10a-anva-14
TRANSCRIPT
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 1/7
102
COMPARACIÓN DE TRES O MÁS MEDIAS
Ing. Luz Bullón Camarena
Para la comparación de más de dos grupos, las pruebas Z o t no pueden aplicarse. Sise efectúan múltiples pruebas entre los pares diferentes de medias, el nivel de
significación empleado en cada comparación, se altera (incrementándose) respectoal nivel de significación de una prueba global o del experimento como un todo. Los datos deben ser analizados mediante el Análisis de Variancia - ANVA. Este
procedimiento evita esta alteración de
Los datos muestrales:
Grupos (tratamientos)Total1 2 ... k
Y 11
Y 12 ...
Y 1n1
Y 21 Y 22
Y 2n2
Y ij
Y k1
Y k2
Y knk
Nº de unidadesTotales
MediasVariancias
n1
j
jY 1 =Y 1
1Y 2
1
s
n2
j
jY 2 =Y 2
2Y 2
2
s
nk
j
jk Y =Y k
k Y 2
k
s
n = ni
i j
jiY =Y
Y
Y ij observación, j -ésima perteneciente al grupo o tratamiento i k número de grupos comparados o tratamientosni número de observaciones del i -ésimo tratamienton número total de observaciones del estudio
Y promedio general de todas las observaciones
El ANVA responde en un principio, si la media de alguno de los grupos es diferente delas demás o si hay una diferencia cualquiera entre los grupos. Si el ANVA resultasignificativo, es decir si se ha encontrado alguna diferencia, se pueden hacercomparaciones entre pares o combinaciones de grupos.
EL A N V A
Es una forma de dividir la variación total de las observaciones en dos partes. Si elvalor observado en un individuo es Y i j , se considera cuánto difiere éste de la mediaglobal de todos los individuos del estudio sin importar el grupo al que pertenecen,
Y - Y ij .
Esta diferencia puede dividirse en dos partes; la diferencia entre el individuo y la mediadel grupo de este individuo y la diferencia entre la media del grupo y la media global o
gran media. En símbolos,
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 2/7
103
Y - Y + Y - Y =Y - Y iiijij
El ANVA considera la variación de los individuos de los k grupos y la divide en:1. la variación de cada individuo y la media de su grupo2. la variación entre la media de cada grupo y la media global.
Considerando la variación de todos los individuos del experimento
2
2
iiji
k
i
n
j
ij Y - Y Y - Y =Y -Y i
i j
iiji Y - Y Y - Y =22
Suma de cuadrados total: SCT
n
Y
Y =Y -Y ij
k
i
n
j
ij
i 222
Suma de cuadrados entre grupos (o entre tratamientos): SCTrat
n
Y
n
Y Y -Y nY - Y
i i
ii
i
i
i j
i
2222
Suma de cuadrados dentro de grupos (debida al error aleatorio): SCError
22
)1( ii
i j
iij snY - Y
Si las medias de los grupos son bastante diferentes entre sí, habrá variaciónconsiderable entre éstas y la gran media, comparada con la variación dentro de cadagrupo. Por el contrario, si las medias de los grupos no difieren mucho, la variaciónentre éstas y la media global no será mucho mayor que la variación entre individuos decada grupo. Por lo tanto, puede usarse la prueba F para dos variancias para probar larazón de la variancia entre medias a la variancia de cada grupo.
La hipótesis nula para la prueba F es que las dos variancias son iguales; si lo son, lavariación entre medias no es mucho mayor que la variación entre observaciones
individuales dentro de un grupo dado. Por consiguiente, no hay evidencia suficientepara concluir que las medias son diferentes una de otra. De esta forma el ANVA esuna prueba de igualdad de medias, aun cuando en el proceso se prueban lasvariancias.
La hipótesis nula es, k 210 = . . . = = : H . Si la hipótesis nula se rechaza,
se concluye que no todas las medias son iguales, o que alguna de ellas difiere de lasdemás; sin embargo, no se sabe cuáles no son iguales, por esta razón se hacennecesarios procedimientos de comparación posteriores.
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 3/7
104
CUADRO DEL ANVA
Fuente de
Variación
Grados delibertad Suma de Cuadrados Cuadrados
medios
Razón F
Factor(Entre Grupos)
k - 1SC G =
22 ( )i ji
i
Y Y -
n n
1- k
C S = M C G
G M C
M C = F
E
Gcalc
Error(Dentro degrupos)
n - k C S -C S =C S GT E
k -n
C S = M C E
E
Total n - 1SC T =
2( )i j2i j
Y -Y
n
Una fórmula semejante puede usarse para encontrar la variancia de las medias degrupos respecto a la gran media:
Estimación de la variancia de medias =1-k
)Y - Y ( n2
ii
donde ni es el número de observaciones en cada grupo y k es el número de grupos.
Esta estimación se denomina cuadrado medio entre grupos (CMG) y tiene k -1grados de libertad.
Para obtener la variancia de las observaciones respecto a su media del grupo, seemplea una variancia ponderada como en la prueba t para grupos independientes:
Estimación de variancias dentro de grupos =
)1(
)1(
i
i
2
i
n
S n
Esta estimación se denomina cuadrado medio dentro de grupos o cuadrado mediodel error ( CME ) y tiene k (ni –1) grados de libertad o si el número total deobservaciones es n, se tienen n - k grados de libertad.
La razón F se forma dividiendo ambas estimaciones,
E
G
CM
CM
gruposdedentromedioCuadrado
gruposentremedioCuadrado = F
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 4/7
105
y tiene k -1 y n - k grados de libertad.
Si el valor observado de la razón F es mayor que el valor crítico de la tabla, se rechazala hipótesis nula de igualdad de medias. El rechazo de la hipótesis nula no informasobre los grupos que difieren, por lo tanto se debe estudiar la forma de determinarcuáles grupos específicos difieren.
Si F F -1c se rechaza H 0
0
F
Distribución F - Regiones de Decisión
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 5/7
106
EJEMPLO 1
Un estudio clínico realizado en Perú buscaba examinar la influencia de lossuplementos de hierro y zinc en la absorción de estos minerales por los glóbulos rojos
en mujeres embarazadas. Se seleccionaron 37 mujeres embarazadas (33 1semanas de embarazo) de características médicas y biológicas similares y sedistribuyeron aleatoriamente en tres grupos: el grupo A de 10 mujeres, recibió un
suplemento diario prenatal de 60 mg Fe y 250 g folatos sin Zinc, el grupo B de 12
mujeres, recibió un suplemento diario prenatal de 60 mg Fe y 250 g folatos con 15mg de Zinc y el grupo C, “Control” en el que habían 15 mujeres, no recibió ningúnsuplemento férrico prenatal.Los suplementos se administraron durante un período que se inició entre la semana10 y la semana 24 hasta el parto. A continuación se presentan los niveles de ferritina
sérica, g/L, de las pacientes,
Ferritina sérica ( g/L) A B C
8.96 23.87 7.29
18.98 30.23 5.45
17.43 26.76 10.21
13.51 34.45 10.73
14.60 15.75 3.21
26.12 16.17 3.44
21.32 11.30 21.65
15.96 12.51 14.01
18.23 14.53 18.64
27.39 23.00 18.28
12.54 14.16
5.85 14.15
8.87
6.55
10.13
ni 12 10 15 37
Promedio 16.74 20.86 11.12 15.5738
Total 200.89 208.57 166.77 576.23
Desv.Estánd 6.342 7.960 5.617
Término de Corrección = TC =n
Y ij2
)( =
37
23.576 2
12359.10846
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 6/7
107
o Suma de Cuadrados de Tratamientos:
TC Y Y Y
TC n
Y Y Y
j j j
i i
i
i j
i
151012
2
3
2
2
2
12
.2
= 10846.1235915
77.166
10
57.208
12
89.200 222
= 593.3
o Suma de Cuadrados del Total:
TCY...YY153
YYYY 2
15,3
2
12
2
11
2
..
ij
2
ij
i j
2..ij
= 8.962 + 18.982 + . . . +5.852 + . . . + 6.552 +10.132 – 12359.10846 = 2047.7
o Suma de Cuadrados del Error
S. C. Error = S. C. Total – S. C. Tratamientos
= 2047.7 - 593.3 = 1454.5
Cuadro del ANVA
Fuentes de
VariaciónG. L. S. C. C. M. Fcalc
Tratamientos 3 – 1 = 2 593.3 296.6 6.93
Error 37 - 3 = 34 1454.5 42.8
Total 37 – 1 = 36 2047.7
Hipótesis acerca de efectos de Tratamientos
Ho : 1. = 2. = 3. =
H1 : al menos un i. , i = 1, 2, 3.
Nivel de significación = 0.05
Cálculo de la estadística de prueba (evidencia muestral)
93.68.42
6.296
..
..
Error M C
osTratamient M C F calc
F tabular (0.05) y G.L 2/34 = 6.22
Conclusión
Dado que Fcal > Ftab, existe suficiente evidencia estadística para rechazar lahipótesis nula. Podemos concluir que al menos uno de los grupos presenta un
nivel medio de ferritina sérica distinto que el resto.
8/19/2019 10A-ANVA-14
http://slidepdf.com/reader/full/10a-anva-14 7/7
108
EJEMPLO.2
Se quiere determinar si las dietas A, B, C y D presentan diferencias en función de susefectos sobre el incremento de peso en ratones. Se seleccionaron 20 ratones decierta especie de la población general y luego los asignaron aleatoriamente a lostratamientos. Después de un periodo determinado, se midió el aumento de peso decada ratón (en gramos) y se obtuvieron los datos que se muestran.
Dieta A Dieta B Dieta C Dieta D
3237343330
3638373034
3530362931
2930343127
Medias 33.2 35.0 32.2 30.2Desv.Est. 2.588 3.162 3.114 2.588
Las hipótesis:
43210 == = : H
No hay diferencia en la respuesta media del incremento de peso, entre estascuatro dietas
H1 : Alguna dieta difiere de las demás
Nivel de significación = 0.05
ANÁLISIS DE LA VARIANCIA
FUENTE G.L S.C C.M FCALC
DietasError
316
60.15132.4
20.058.28
2.42
Total 19 192.55
F tabular (0.05) y G.L 3/16 = 6.30
F calculado 2.42 No hay significación estadística
Conclusión:
Dado que Fcal < Ftab, no existe evidencia estadística para rechazar la hipótesisnula. Podemos concluir que no hay diferencia en la respuesta media delincremento de peso, entre las cuatro dietas