Page 6 - Introducción a la Bioestadística con R
P. 6

 con la práctica. En resumidas cuentas, puedes instalarte R solamente, o R y RStudio. Te recomiendo la segunda opción ya que RStudio facilita el uso de R haciéndolo más intuitivo.
Por otro lado, R es un programa ‘a la carta’, de manera que cada persona lo configura y aprende según sus propias necesidades analíticas. Además de las utilidades básicas, hay muchísimos recursos en R en forma de ‘paquetes’, que son extensiones de R donde usuarios muy avanzados han compilado códigos, datos y documentación en un formato predeterminado para que otros usuarios lo puedan instalar y utilizar. Estos paquetes se encuentran en repositorios como CRAN (https://cran.r-project.org) y Bioconductor (https://bioconductor.org), que es más específico para bioestadística. Normalmente estos paquetes se han desarrollado por grupos de bioinformáticos de diferentes universidades o centros de investigación con financiación pública, de manera que el lanzamiento del paquete suele ir acompañado de una publicación que lo presenta (¡recuerda citarlo si lo utilizas!).
Aprender a usar R es un trabajo muy personal porque, aunque hay mucha documentación disponible, eres tú quien determina qué necesitas saber y cómo configurar tu propia ruta de aprendizaje buscando tutoriales, libros, ayuda en foros, cursos, etc., hasta que ves que tus necesidades están cubiertas. Este camino puede ser un poco tedioso, pero al mismo tiempo te permitirá avanzar mucho en tu trabajo de investigación. Algunos recursos online que he encontrado útiles son Quick-R (https://www.statmethods.net) que está muy bien organizado y es útil en los niveles iniciales y STHDA (http://www.sthda.com/english/), que es interesante sobre todo para “High-throughput data analysis”.
Para terminar quiero resaltar la sistemática detrás del procesado de datos en R. Mientras que en muchos paquetes estadísticos como SPSS los análisis están prescritos, y el usuario simplemente necesita seleccionar las casillas de su interés y extraer los resultados del extenso reporte que se genera, en R el proceso es completamente diferente. En vez de realizar todos los análisis de una vez, el usuario desarrolla su protocolo de manera muy personalizada interactuando con el programa. Es decir, ejecutas un comando, por ejemplo, un modelo estadístico, y en base a los resultados ejecutas el segundo comando que en este caso podrían ser los gráficos de diagnóstico. Considerando esos resultados en su conjunto entonces avanzas otro paso mas y diseñas una validación cruzada, y así sucesivamente. A esto en inglés se le llama ‘pipeline’ (que traducido al español significaría tubería u oleoducto), porque el resultado de un paso se convierte en el material necesario para ejecutar el siguiente. Si bien este proceso es más laborioso que la mera selección de casillas en un software con GUI, también es cierto que te permite tener mayor control y requiere un conocimiento más profundo de la estadística que estás empleando ya que tienes que familiarizarte a fondo por ejemplo con los supuestos que se asumen en cada modelo y el tipo de control de calidad que es necesario emplear.
En resumen, aprender R te permitirá desarrollar los análisis bioestadísticos más avanzados en tu campo, comprender mejor tus datos y tener mayor control sobre las estadísticas empleadas. ¡Y puede llegar a ser adictivo!
En este curso vamos a aprender los conceptos básicos de R y los modelos más comunes en bioestadística. En la siguiente sección veremos cómo instalar R y cómo este programa en realidad es una especie de súper calculadora.
Introducción a la Bioestadística con R
    2



























































































   4   5   6   7   8