Page 41 - Introducción a la Bioestadística con R
P. 41
Sección 4: Estadísticas descriptivas y gráficos básicos. Conceptos clave.
Introducción a la Bioestadística con R
•
•
•
•
La estadística puede clasificarse en dos tipos, descriptiva e inferencial. La estadística descriptiva es la metodología que se emplea para caracterizar un conjunto de datos. Sin embargo, no podemos extraer conclusiones debido a la variabilidad de las muestras. La estadística inferencial complementa a la descriptiva permitiendo sacar conclusiones extrapolables a la población gracias al empleo de métodos probabilísticos.
Algunos estadísticos descriptivos básicos son la media, la mediana y la moda. La media representa la distribución equitativa de los datos si la suma total se repartiera por igual. La mediana es el valor central si todos los datos se ordenan de menor a mayor, y la moda es el valor que más se repite en nuestra base de datos.
El rango, el valor máximo y mínimo, la variabilidad y la desviación estándar son algunas de las medidas que se usan más habitualmente para describir la variabilidad de la muestra. El rango se usa para conocer la cobertura de nuestros datos, siendo la medida del esparcimiento entre el valor máximo y mínimo de nuestra muestra. Se ve muy afectado por los valores máximos y mínimos; una forma de paliar este problema es usando el rango intercuartil, resultado de dividir los datos en cuatro fracciones de igual tamaño.
Finalmente, la varianza representa la desviación cuadrática promedio de la media. La desviación estándar es la raíz cuadrada de la varianza.
Empezaremos esta sección por decir que R tiene una serie de bases de datos disponibles para usarlas como ejemplos y aprender las distintas funciones del programa. Las más conocidas son i) mtcars, sobre motores y coches; ii) iris (sobre las medidas de los sépalos, pétalos y otras características de los lirios); iii) ToothGrowth, que contiene resultados sobre un estudio con vitamina C en el crecimiento de los dientes de 60 conejillos de indias; iv) PlantGrowth, sobre la producción de un cultivo con dos tratamientos distintos; y v) USArrests sobre estadísticas criminales en Estados Unidos. Para cargar los datos de una de estas bases de datos en tu sesión de R y visualizarlos puedes usar los siguientes comandos:
37