Page 113 - Introducción a la Bioestadística con R
P. 113

 Ejercicio 22. Regresión linear múltiple en R.
Para este ejercicio vamos a utilizar la base de datos “ProsCancer-mod” que contiene información sobre distintas variables analizadas en pacientes con cáncer de próstata. Importamos la base de datos y utilizamos la función attach() cómo hemos visto anteriormente para adjuntar los datos, y echamos un primer vistazo a la información contenida con la función head(). Además, podemos comprobar el tipo de variable que R ha asignado a cada variable con la función class() y corregir aquellas que pudieran ser erróneas.
En concreto vamos a examinar si existe una relación lineal entre la variable dependiente “lbph” (benign prostate hyperplasia) y las variables independientes “age”, “lcavol” (cancer volume) y “lweight” (prostate weight). Para ello utilizamos la función lm():
Aunque los resultados de la función lm() dan por ejemplo el valor de la constante “a” (intercept), no nos ofrecen mucha información extra sobre el ajuste del modelo, por lo que recurrimos a la función summary() para ampliarla:
Introducción a la Bioestadística con R
   109





























































































   111   112   113   114   115