Page 86 - Introducción a la Bioestadística con R
P. 86
Si la mayoría de los datos se aproximan a la linea, podemos confirmar que nuestros datos siguen una distribución normal, mientras que si los residuos se alejan de la linea es que no siguen una distribución normal.
Comprobación de normalidad mediante un test de Shapiro-Wilk.
Aunque existen otros test (D’Agostino-Pearson, Kolmogorov-Smironov, Jarque-Barre, etc.) o herramientas que compruban varios de ellos a la vez, generalmente con un test de Shapiro-Wilk mediante la función `shapiro.test()`, es suficiente:
El test de Shapiro-Wilk comprueba la hipótesis nula de que los datos provienen de una distribución normal contra la hipótesis alternativa de que no lo hacen.
Considerando que se necesita un alfa o p-valor inferior a 0.05 para poder rechazar la hipótesis nula, el resultado del test de Shapiro-Wilk nos indica que **la distribución sigue una normal** (p- valor > 0.05, no podemos rechazar la hipótesis nula de normalidad).
NOTA: En datasets grandes, el test de Shapiro-Wilk puede dar como resultado un p-valor significativo (<0.05) indicándonos que no se trata de una distribución normal, aunque esta se aproxime. Dada esta situación, y teniendo en cuenta la tolerancia de la ANOVA a que los datos se alejen un poco de la normal, hace que la visualización de los datos en histogramas o en Q_Q plots sean adecuados para hacernos una idea de como "normal" es nuestra distribución.
Introducción a la Bioestadística con R
82