10a-anva-14

7
8/19/2019 10A-ANVA-14 http://slidepdf.com/reader/full/10a-anva-14 1/7  102 COMPARACIÓN DE TRES O MÁS MEDIAS Ing. Luz Bullón Camarena Para la comparación de más de dos grupos, las pruebas Z o t no pueden aplicarse. Si se efectúan múltiples pruebas entre los pares diferentes de medias, el nivel de significación  empleado en cada comparación, se altera (incrementándose) respecto al nivel de significación de una prueba global o del experimento como un todo.  Los datos deben ser analizados mediante el Análisis de Variancia - ANVA. Este procedimiento evita esta alteración de Los datos muestrales: Grupos (tratamientos) Total 1 2 ... k 11 12  . . . 1n1  21  22 2n2  ij k1 k2 knk Nº de unidades Totales Medias Variancias n 1    j  j 1 =1 1  2 1  s  n 2    j  j 2 = 2  2 2  s  n k    j  j =  2  s  n =  n i   i j  j i =  ij  observación, j -ésima perteneciente al grupo o tratamiento   número de grupos comparados o tratamientos n i número de observaciones del -ésimo tratamiento n número total de observaciones del estudio  promedio general de todas las observaciones El ANVA responde en un principio, si la media de alguno de los grupos es diferente de las demás o si hay una diferencia cualquiera entre los grupos. Si el ANVA resulta significativo, es decir si se ha encontrado alguna diferencia, se pueden hacer comparaciones entre pares o combinaciones de grupos. EL A N V A Es una forma de dividir la variación total  de las observaciones en dos partes. Si el valor observado en un individuo es i j  , se considera cuánto difiere éste de la media global de todos los individuos del estudio sin importar el grupo al que pertenecen,  -  ij . Esta diferencia puede dividirse en dos partes; la diferencia entre el individuo y la media del grupo de este individuo y la diferencia entre la media del grupo y la media global o gran media. En símbolos,

Upload: jose-luis

Post on 07-Jul-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 1/7

  102

COMPARACIÓN DE TRES O MÁS MEDIAS

Ing. Luz Bullón Camarena

Para la comparación de más de dos grupos, las pruebas Z o t no pueden aplicarse. Sise efectúan múltiples pruebas entre los pares diferentes de medias, el nivel de

significación  empleado en cada comparación, se altera (incrementándose) respectoal nivel de significación de una prueba global o del experimento como un todo. Los datos deben ser analizados mediante el Análisis de Variancia - ANVA. Este

procedimiento evita esta alteración de

Los datos muestrales:

Grupos (tratamientos)Total1 2 ... k

Y 11

Y 12 ...

Y 1n1 

Y 21 Y 22

Y 2n2 

Y ij

Y k1

Y k2

Y knk

Nº de unidadesTotales

MediasVariancias

n1 

 j

 jY 1 =Y 1 

1Y   2

1

 s 

n2 

 j

 jY 2 =Y 2  

2Y   2

2

 s  

nk 

 j

 jk Y  =Y k  

k Y   2

 s  

n =  ni 

i j

 jiY  =Y  

Y  

Y ij  observación, j -ésima perteneciente al grupo o tratamiento i  k   número de grupos comparados o tratamientosni número de observaciones del i -ésimo tratamienton  número total de observaciones del estudio

Y   promedio general de todas las observaciones

El ANVA responde en un principio, si la media de alguno de los grupos es diferente delas demás o si hay una diferencia cualquiera entre los grupos. Si el ANVA resultasignificativo, es decir si se ha encontrado alguna diferencia, se pueden hacercomparaciones entre pares o combinaciones de grupos.

EL A N V A 

Es una forma de dividir la variación total de las observaciones en dos partes. Si elvalor observado en un individuo es Y i j   , se considera cuánto difiere éste de la mediaglobal de todos los individuos del estudio sin importar el grupo al que pertenecen,

Y  - Y ij .

Esta diferencia puede dividirse en dos partes; la diferencia entre el individuo y la mediadel grupo de este individuo y la diferencia entre la media del grupo y la media global o

gran media. En símbolos,

Page 2: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 2/7

  103

Y  - Y + Y  - Y =Y  - Y  iiijij  

El ANVA considera la variación de los individuos de los k grupos y la divide en:1. la variación de cada individuo y la media de su grupo2. la variación entre la media de cada grupo y la media global.

Considerando la variación de todos los individuos del experimento

    2

2

  iiji

i

n

 j

ij Y  - Y Y  - Y =Y -Y i

 

    i j

iiji Y  - Y Y  - Y =22

 

Suma de cuadrados total: SCT

n

Y =Y -Y  ij

i

n

 j

ij

i   222

   

Suma de cuadrados entre grupos (o entre tratamientos): SCTrat

n

n

Y Y -Y nY  - Y 

i i

ii

i

i

i j

i

2222

   

Suma de cuadrados dentro de grupos (debida al error aleatorio): SCError

      22

)1( ii

i j

iij  snY  - Y   

Si las medias de los grupos son bastante diferentes entre sí, habrá variaciónconsiderable entre éstas y la gran media, comparada con la variación dentro de cadagrupo. Por el contrario, si las medias de los grupos no difieren mucho, la variaciónentre éstas y la media global no será mucho mayor que la variación entre individuos decada grupo. Por lo tanto, puede usarse la prueba F para dos variancias para probar larazón de la variancia entre medias a la variancia de cada grupo.

La hipótesis nula para la prueba F es que las dos variancias son iguales; si lo son, lavariación entre medias no es mucho mayor que la variación entre observaciones

individuales dentro de un grupo dado. Por consiguiente, no hay evidencia suficientepara concluir que las medias son diferentes una de otra. De esta forma el ANVA esuna prueba de igualdad de medias, aun cuando en el proceso se prueban lasvariancias.

La hipótesis nula es,    k 210  = . . . = = :  H  . Si la hipótesis nula se rechaza,

se concluye que no todas las medias son iguales, o que alguna de ellas difiere de lasdemás; sin embargo, no se sabe cuáles no son iguales, por esta razón se hacennecesarios procedimientos de comparación posteriores.

Page 3: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 3/7

  104

CUADRO DEL ANVA 

Fuente de

Variación

Grados delibertad Suma de Cuadrados Cuadrados

medios

Razón F

Factor(Entre Grupos)

k - 1SC G  =

22 ( )i ji

i

 Y  Y   -

n n

 

1- k 

C S  = M C  G

G   M C 

 M C  = F 

 E 

Gcalc  

Error(Dentro degrupos)

n - k   C S -C S =C S  GT  E   

k  -n

C S  = M C   E 

 E   

Total n - 1SC T   =

2( )i j2i j

  Y   -Y 

n

 

Una fórmula semejante puede usarse para encontrar la variancia de las medias degrupos respecto a la gran media:

Estimación de la variancia de medias =1-k 

 )Y  - Y (  n2

ii

 

donde ni  es el número de observaciones en cada grupo y k  es el número de grupos.

Esta estimación se denomina cuadrado medio entre grupos  (CMG) y tiene k -1grados de libertad.

Para obtener la variancia de las observaciones respecto a su media del grupo, seemplea una variancia ponderada como en la prueba t  para grupos independientes:

Estimación de variancias dentro de grupos =

)1(

)1(

i

i

2

i

n

S n 

Esta estimación se denomina cuadrado medio dentro de grupos o cuadrado mediodel error ( CME  ) y tiene k   (ni  –1) grados de libertad o si el número total deobservaciones es n, se tienen n - k   grados de libertad.

La razón F  se forma dividiendo ambas estimaciones,

 E 

G

CM 

CM 

 gruposdedentromedioCuadrado

 gruposentremedioCuadrado = F     

Page 4: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 4/7

  105

y tiene k -1 y n - k   grados de libertad.

Si el valor observado de la razón F  es mayor que el valor crítico de la tabla, se rechazala hipótesis nula de igualdad de medias. El rechazo de la hipótesis nula no informasobre los grupos que difieren, por lo tanto se debe estudiar la forma de determinarcuáles grupos específicos difieren.

Si  F   F  -1c       se rechaza  H 0  

0

F

Distribución F - Regiones de Decisión

 

Page 5: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 5/7

  106

EJEMPLO 1

Un estudio clínico realizado en Perú buscaba examinar la influencia de lossuplementos de hierro y zinc en la absorción de estos minerales por los glóbulos rojos

en mujeres embarazadas. Se seleccionaron 37 mujeres embarazadas (33   1semanas de embarazo) de características médicas y biológicas similares y sedistribuyeron aleatoriamente en tres grupos: el grupo A  de 10 mujeres, recibió un

suplemento diario prenatal de 60 mg Fe y 250 g folatos sin Zinc, el grupo B de 12

mujeres, recibió un suplemento diario prenatal de 60 mg Fe y 250 g folatos con 15mg de Zinc y el grupo C, “Control” en el que habían 15 mujeres, no recibió ningúnsuplemento férrico prenatal.Los suplementos se administraron durante un período que se inició entre la semana10 y la semana 24 hasta el parto. A continuación se presentan los niveles de ferritina

sérica, g/L, de las pacientes,

Ferritina sérica ( g/L) A B C

8.96 23.87 7.29

18.98 30.23 5.45

17.43 26.76 10.21

13.51 34.45 10.73

14.60 15.75 3.21

26.12 16.17 3.44

21.32 11.30 21.65

15.96 12.51 14.01

18.23 14.53 18.64

27.39 23.00 18.28

12.54 14.16

5.85 14.15

8.87

6.55

10.13

ni 12 10 15 37

Promedio 16.74 20.86 11.12 15.5738

Total 200.89 208.57 166.77 576.23

Desv.Estánd 6.342 7.960 5.617

Término de Corrección = TC  =n

Y ij2

)( =

37

23.576   2

12359.10846 

Page 6: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 6/7

  107

o  Suma de Cuadrados de Tratamientos:

TC Y Y Y 

TC n

Y Y Y 

 j j j

i i

i

i j

i  

  151012

2

3

2

2

2

12

.2 

= 10846.1235915

77.166

10

57.208

12

89.200   222

= 593.3 

o  Suma de Cuadrados del Total:

  TCY...YY153

YYYY   2

15,3

2

12

2

11

2

..

ij

2

ij

i j

2..ij  

   

= 8.962 + 18.982 + . . . +5.852 + . . . + 6.552 +10.132  – 12359.10846 = 2047.7 

o  Suma de Cuadrados del Error

S. C. Error = S. C. Total – S. C. Tratamientos

= 2047.7 - 593.3 = 1454.5 

Cuadro del ANVA

Fuentes de

VariaciónG. L. S. C. C. M. Fcalc

Tratamientos 3 – 1 = 2 593.3 296.6 6.93

Error 37 - 3 = 34 1454.5 42.8

Total 37 – 1 = 36 2047.7

Hipótesis acerca de efectos de Tratamientos

Ho : 1. = 2. = 3. =

H1 : al menos un i.   , i = 1, 2, 3. 

Nivel de significación = 0.05

Cálculo de la estadística de prueba (evidencia muestral)

93.68.42

6.296

..

..

 Error  M C 

osTratamient  M C  F calc  

F tabular (0.05) y G.L 2/34 = 6.22

Conclusión 

Dado que Fcal  > Ftab, existe suficiente evidencia estadística para rechazar lahipótesis nula. Podemos concluir que al menos uno de los grupos presenta un

nivel medio de ferritina sérica distinto que el resto.

Page 7: 10A-ANVA-14

8/19/2019 10A-ANVA-14

http://slidepdf.com/reader/full/10a-anva-14 7/7

  108

EJEMPLO.2

Se quiere determinar si las dietas A, B, C y D presentan diferencias en función de susefectos sobre el incremento de peso en ratones. Se seleccionaron 20 ratones decierta especie de la población general y luego los asignaron aleatoriamente a lostratamientos. Después de un periodo determinado, se midió el aumento de peso decada ratón (en gramos) y se obtuvieron los datos que se muestran.

Dieta A Dieta B Dieta C Dieta D

3237343330

3638373034

3530362931

2930343127

Medias 33.2 35.0 32.2 30.2Desv.Est. 2.588 3.162 3.114 2.588

Las hipótesis:

43210  == = : H  

No hay diferencia en la respuesta media del incremento de peso, entre estascuatro dietas

H1 : Alguna dieta difiere de las demás

Nivel de significación = 0.05

ANÁLISIS DE LA VARIANCIA

FUENTE G.L S.C C.M FCALC

DietasError

316

60.15132.4

20.058.28

2.42

Total 19 192.55

F tabular (0.05) y G.L 3/16 = 6.30

F calculado 2.42 No hay significación estadística

Conclusión:

Dado que Fcal < Ftab, no existe evidencia estadística para rechazar la hipótesisnula. Podemos concluir que no hay diferencia en la respuesta media delincremento de peso, entre las cuatro dietas