Page 31 - Introducción a la Bioestadística con R
P. 31

 Imaginemos que queremos renombrar el tratamiento 1, que es el tratamiento tradicional, como “Tratamiento clásico”, y al tratamiento 2 como “Tratamiento avanzado”. En este caso, R coloca automáticamente el tratamiento 2 en primer lugar porque la “A” va antes que la “C” en el alfabeto. Vemos ahora cómo evitar ese problema.
Habitualmente se importa la base de datos desde Excel, los datos no se introducen de manera manual. Sin embargo, en ciertas ocasiones R puede no entender bien que una columna o vector se trata en realidad de un factor, y podría a llegar a clasificarla de otra manera (por ejemplo, como una variable numérica). Ahora vamos a ver cómo interrogar una variable para ver si es un factor y corregirlo si no es así.
Como puedes ver por el resultado de esta sección, la variable cancer_tto sí era un factor, y la respuesta de R ha sido "TRUE" (VERDADERO). Sin embargo, la variable evento_cardiaco no era un factor, la respuesta de R ha sido "FALSE" (FALSO). Al usar la función as.factor() podemos hacer que aunque no sea un factor, R lo trate como tal y en el resultado nos indica incluso los niveles que ha detectado. También puedes crear una nueva variable donde se almacene como factor de manera permanente evento_cardiaco_factor <- as.factor(evento_cardiaco).
Para conocer el numero de niveles de un factor se puede usar la función summary(). Intenta ver que salida obtienes aplicando summary() al factor cancer_tto.
Introducción a la Bioestadística con R
    27





























































































   29   30   31   32   33