Monografías
Publicar | Monografías por Categorías | Directorio de Sitios | Software Educativo | Juegos Educativos | Cursos On-Line Gratis

 

Análisis de la Varianza parte 1 - Monografía



 
DESCARGA ESTA MONOGRAFÍA EN TU PC
Esta monografía en formato html para que puedas guardarla en tu pc e imprimirla.



Vínculo Patrocinado




Aquí te dejamos la descarga gratuita
Nota: para poder abrir archivos html solo necesitas tener instalado internet explorer u otro navegador web.




PRUEBA DE LA VARIANZA CON UNA POBLACIÓN



A veces, los analistas investigan la variabilidad de una población, en lugar de su media o proporción.
Esto es debido a que la uniformidad de la producción muchas veces es crítica en la práctica industrial.
La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hipótesis está diseñada para determinar si la varianza de una población es igual a algún valor predeterminado.
La desviación estándar de una colección de datos se usa  para  describir la variabilidad en esa colección y se puede definir como la diferencia estándar entre los elementos de una colección de datos y su media.
La varianza de un conjunto de datos se define como el cuadrado de su desviación estándar; y la varianza muestral se utiliza para probar la hipótesis nula que se refiere a la variabilidad y es útil para entender el pocedimiento de análisis de la varianza.
La hipótesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algún valor previamente especificado. Como el aspecto de interés, por lo general es si la varianza de la población es mayor que este valor, siempre se aplica una de una cola.
Para probar la hipótesis nula, se toma una muestra aleatoria de elementos de una población que se investiga; y a partir de esos datos, se calcula el estadístico de prueba.
Para este cálculo se utiliza la siguiente ecuación:
2252.gif

Donde:

* n-1 = Grados de libertad para la prueba de tamaño n.

* s2 = Varianza muestral.

*  2 = Varianza poblacional si y solo si suponemos que la hipótesis nula
es cierta.

EJEMPLO



1.- Averiguar si la variabilidad de edades en una comunidad local es la misma o mayor que la de todo el Estado. La desviación estándar de las edades del Estado, conocida por un estudio reciente es de 12 años. Tomamos una muestra aleatoria de 25 personas de la comunidad y determinamos sus edades. Calcular la varianza de la muestra y usar la ecuación anteriormente explicada para obtener el estadístico muestral.
Las hipótesis nula y alternativas son:

2253.gif

Se toma la muestra y resulta una desviación estándar muestral de 15
Años. La varianza de la muestra es entonces 225, y el estadístico ji cuadrada de la muestra es:

2254.gif
Si la hipótesis nula es cierta, el estadístico muestral de 37,5 se obtiene de la distribución ji cuadrada teórica, en particular, la distribución con 24 grados de libertad ( 25 - 1 = 24 ).
Como se puede observar en la ecuación anterior, cuanto mas grande es la varianza muestral respecto a la varianza poblacional hipotética, mas grande es el estadístico que se obtiene. Luego deducimos que de un estadístico muestral grande llevamos al rechazo de la hipótesis nula, y un estadístico muestral pequeño implicará que no se rechaze. La tabla ji cuadrada se usa para determinar si es probable o no que el valor 37,5 haya sido obtenido de la distribución muestral ji cuadrada hipotética.
Supongamos que esta prueba debe llevarse a un nivel de significancia de 0,02. En la columna 0,02 de la tabla de ji cuadrada y la fila 24, se encuentra el valor critico de 40, 27. La regla de decisión es:

Si  2   40,27, se rechaza la hipótesis nula de que la varianza de la población es 144 ( Se rechaza H0 si  2 > 40,27 ).

Como estadístico de prueba calculado es 37,5, la hipótesis nula no se rechaza (con riesgo de un error de tipo II). Si en la tabla de ji cuadrada se hubiese elegido un alfa de 0,05, el valor crítico de la tabla sería 36,415, y la hipótesis nula se hubiera rechazado (37,5 > 36,415). En este ejemplo se ilustra la importancia de pensar con cuidado en el riesgo apropiado de un error de tipo I en una prueba de hipótesis.
Se supone que la hipótesis nula es cierta, lo que conduce a la obtención de un estadístico muestral de una distribución ji cuadrada con 2 grados de libertad.

2255.gif

PRUEBA DE LA VARIANZA CON DOS POBLACIONES



En ocasiones es importante comparar dos poblaciones para ver si una es mas variable que la otra en alguna medida específica. La hipótesis nula es que las dos poblaciones tienen la misma varianza, y la hipótesis alternativa es que una tiene mayor varianza que la otra. Se obtienen muestras aleatorias de cada población y se calculan las varianzas muestrales. Estos valores se usan entonces en la ecuación siguiente para calcular el estadístico de la muestra:

22521.gif

Donde:

- S12 = Varianza de la muestra 1
- S22 = Varianza de la muestra 2

Nota: Por convivencia, para encontrar los valores de F, por lo general se pone en el numerador la varianza muestral mas grande.

El estadístico de prueba dado por la ecuación anteriormente nombrado,
es el cociente F . Si la hipótesis nula de varianzas poblacionales iguales es
cierta, la razón de las varianzas muestrales se obtiene de la distribución F
teórica. Al consultar la tabla F se puede evaluar la probabilidad de este suceso.
Si parece probable que el cociente F pueda haberse obtenido de la distribución
muestral supuesta, la hipótesis nula no se rechaza. Si es poco probable que el
cociente F se haya obtenido de la distribución supuesta, la hipótesis nula se
rechaza.
La distribución F especifica que se aplica a una prueba en particular queda determinada por dos parámetros: los grados de libertad para el numerador y los grados de libertad para el  denominador. Cada uno de estos valores es n-1. Si se conocen estos valores y se elige un valor alfa, al valor crítico de F se puede encontrar en la tabla F.

EJEMPLO


1.- Averiguar si la variabilidad del salario por hora es la misma en dos sucursales, o si la variabilidad de la sucursal 1 es mayor que la de la sucursal 2. La comparación de la variabilidad de las dos sucursales constituye el primer paso en un estudio detallado sobre ingresos.
Se toman muestras aleatorias de los salarios por hora en cada sucursal para determinar las varianzas muestrales y elegimos un nivel de significancia de 0,05. La hipótesis nula y alternativa son:

2257.gif

Los resultados de la muestra son:

2258.gif
El estadístico F se calcula mediante la ecuación anteriormente explicada:
2259.gif

El cociente F indica que la varianza muestral de la población 1 es 2,34 veces la varianza muestral de la población 2. Sin embargo, dados los tamaños de las muestras ¿Es suficiente esta evidencia para rechazar la hipótesis de que las poblaciones tiene la misma varianza?. Se necesita el valor crítico de F para contestar esta pregunta. Primero, se calculan los grados de libertad para el numerador y el denominador:

Gl (numerador) = (n1 - 1) = (21 - 1) = 20
Gl (denominador) = (n2 - 1)  = (25 - 1) = 24

Se usa la tabla F para encontrar el valor crítico. Hay dos valores de F en la tabla: uno para el nivel de significancia de 0,05 y otro para el nivel de 0,01. Al ser ésta una prueba de una cola, como sugiere la hipótesis alternativa, toda el área de 0,05 o de 0,01 estará en el extremo superior de la curva.
Las columnas de la tabla F representan los grados de libertad del numerador, por lo que se selecciona la columna 20. Las filas corresponden a los grados de libertad del denominador, así que se elige la fila 24. El valor crítico de F a un nivel de significancia de 0,05 para 20 grados de libertad en el numerador y 24 grados de libertad en el denominador es 2,02.
El cociente F calculado a partir de los datos de la muestra es 2,34. Según este valor de prueba, la hipótesis nula se rechaza (2,34 > 2,02). Si acepta un riesgo del 5% de un error de tipo I, las poblaciones no tienen la misma varianza.

EJEMPLO



2.- ¿Son iguales las varianzas de dos poblaciones de edades de los artículos en inventario, o la población 2 tiene una mayor varianza? Se toman muestras aleatorias de 53 artículos de cada población de inventario y se calculan las varianzas muestrales. La prueba ha de llevarse a cabo con un nivel de significancia de 0,01. Las hipótesis nula y alternativa son:

2260.gif
Los grados de libertad del numerador y denominador son 52 (53-1). En
La tabla F abreviada, la fila 50 y la columna 50 se usan como aproximaciones de los grados de libertad. La regla de decisión es:

Si el cociente F calculado es mayor que 1,94, se rechaza la hipótesis nula (se rechaza

2261.gif

Los resultados de la muestra son:

S12 = 489        n1 = 53 (inventario 1)
S22 = 1,37        n2 = 53 (inventario 2)

El estadístico F se calcula mediante la ecuación anteriormente explicada:
2262.gif

Una de las varianzas muestrales es 2,8 veces mas grande que la otra. La hipótesis nula se rechaza ya que el estadístico de prueba (2,8) excede al valor crítico (1,94) de la tabla F. Se puede concluir que el inventario 2 tiene mas variabilidad en el tiempo que el inventario 1.


CONCEPTOS BÁSICOS PARA ANOVA



Análisis para la varianza



EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola
variable numérica medida en los elementos de la muestra para probar la
hipótesis nula de igualdad de medias poblaciones. Esta variable puede ser de intervalo o de escala de razón.
Esta variable algunas veces recibe el nombre de variable dependiente, en especial en programas de computadora que ejecutan ANOVA.
La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las hipótesis nula y alternativa en ANOVA son:

2263.gif

EL ANÁLISIS DE LA VARIANZA (ANOVA) ES UN PROCEDIMIENTO ESTADÍSTICO PARA DETERMINAR SI LAS MEDIAS DE TRES O MAS POBLACIONES IGUALES.



En la prueba ANOVA, se reúne evidencia muestral de cada población bajo estudio y se usan estos datos para calcular un estadístico muestral. Después se consulta la distribución muestral apropiada para determinar si el estadístico muestral contradice la suposición de que la hipótesis nula es cierta. Si es así, se rechaza; de lo contrario no se rechaza.
Hemos de recordar que en la prueba de varianza con dos poblaciones se calcula el coeficiente de las varianzas muestrales y se verifica con arreglo a la distribución F. Este procedimiento también se usa en ANOVA para probar la hipótesis nula.
Se supone que todas las poblaciones bajo estudio tienen la misma varianza, sin importar si sus medias son iguales. Es decir, ya sea que las poblaciones tengan medias iguales  o distintas, la variabilidad de los elementos alrededor de su respectiva media es la misma. Si esta suposición es válida, entonces se puede probar la hipótesis nula de las medias poblacionales iguales usando la distribución F.

Método dentro y método entre.


El método dentro para estimar la varianza de las poblaciones produce una estimación válida, sea o no cierta la hipótesis nula. El método entre produce una estimación válida sólo si la hipótesis nula es cierta.

El paso final en ANOVA requiere el cálculo de un cociente con la estimación del método entre en el numerador y la estimación del método dentro en el denominador.. Si la hipótesis nula de que las poblaciones tienen la misma media es cierta, esta razón consiste en dos estimaciones separadas de la misma varianza poblacional y, se puede obtener la distribución F si las medias poblacionales no son iguales. La estimación en el numerador estará inflada, y el resultado será un cociente muy grande. Al consultar la distribución F no es probable que un cociente tan grande haya sido obtenido de esta distribución, y la hipótesis nula será rechazada. La prueba de hipótesis en ANOVA es de una cola: un estadístico F grande llevará al rechazo de la hipótesis nula y un valor pequeño hará que no se rechace.

- METODO DENTRO



El método dentro de estimación de la varianza produce una estimación
válida sin importar si la hipótesis nula de las medias poblacionales iguales es cierta. Esto se debe a que la variabilidad de los valores de la muestra se determina comparando cada elemento en los datos con la media muestral. Cada valor de la muestra obtenido de la población A se compara con la media muestral A; cada elemento obtenido de la población B se compara con la media muestral B, y así sucesivamente. La ecuación para calcular la estimación de la varianza con el método dentro es:

2264.gif
Donde:

- sw2 = Estimación de la varianza muestral con el método entre.
- Xij = i-ésimo elemento de los datos de grupo j.
- Xj = media del grupo j
- C = número de grupos
- N = número de elementos de la muestra en cada grupo.
El doble signo de suma en la ecuación, significa que primero deben sumarse los valores indicados por el signo de la derecha, y después sumar los valores indicados por el de la izquierda. Primero, se encuentran las diferencias entre cada valor x y la media del grupo, se elevan al cuadrado y se suman. Después, se agregan estas sumas para cada grupo. El resultado es la suma del cuadrado de las desviaciones entre cada medida de la muestra y la media de su grupo. Este valor con frecuencia se llama la suma de cuadrados dentro (SCw). Esta suma se divide después entre el número adecuado de grados de libertad para poder producir una estimación de la varianza desconocida de la población.
El número adecuado de grados de libertad para el método dentro se calcula como c(n-1) si el número de observaciones en cada grupo es igual. Como a cada elemento del grupo se le resta la media de ese grupo, sólo (n-1) elementos de cada grupo pueden variar. Además como se tienen c grupos, c se multiplica por (n-1) para obetener los grados de libertad para el método dentro.

EJEMPLO



1.- Se obtienen muestras del peso del llenado de cuatro paquetes de espinacas congeladas, a partir de tres contenedores. La preguntas es si los pesos promedio de los paquetes son iguales o diferentes entre los tres contenedores. Seguidamente se ofrecen los pesos de la muestra (en onzas), medias de grupos, media global y estimación de la varianza con el método dentro usando la ecuación correspondiente.

GRUPO 1        GRUPO 2        GRUPO 3
____________________________________________
12,4            11,9            10,3
13,7            9,3            12,4
11,5            12,1            11,9
10,3            10,6            10,2
12,00            11,00            11,2                                     Media

Media Global   11,4
2265.gif

Cada valor x en la muestra se compara con la media de su propio
Grupo. Estas diferencias se elevan al cuadrado y se suman de acuerdo con la ecuación anteriormente descrita. Los valores que resultan se suman y se
dividen entre los grados de libertad. El resultado, 1,67, es una estimación de la varianza común de las tres poblaciones. Con frecuencia el término 2266.gifse denomina error cuadrático medio (MSE).
La razón por la que el método dentro produce una estimación válida de la varianza desconocida de la población, sin importar el estado de 2267.gif

 EJEMPLO



2.- Se pidió a cuatro personas que beben una marca determinada de café que registraran el número de tazas consumidas por día. Lo mismo se hizo con bebedores de otras tres marcas. Los resultados se muestran en la tabla. Estime la varianza poblacional común mediante el método dentro.
MARCA ” A “        MARCA ” B “        MARCA ” C “        MARCA ” D ”
__________________________________________________________
3            5            2            3
2            1            10            6
5            4            5            4
6            6            7            5
Media        4            4            6            4,5

Media Global  4,625

2268.gif

2269.gif

- METODO ENTRE



El segundo método para estimar la varianza común de la población
produce una estimación válida sólo si la hipótesis nula es cierta. Para entender el método entre recuerde el teorema del límite central. Este importante teorema en estadística establece que la distribución de las medias muestrales tiende a una distribución normal conforme crece el tamaño de la muestra, con una media   y una desviación estándar   n. Si el error estándar de la media es   n, entonces la varianza de la distribución es igual al error estándar al cuadrado, 2270.gif

Esta varianza es una medida de las diferencias entre todas las medias muestrales que puedan obtenerse de la distribución y la media de la población. La raíz cuadrada de esta varianza es el error estándar de la media, es decir, la diferencia estándar entre una media muestral y la media poblacional.
En ANOVA,  para estimar la varianza de la distribución muestral de medias, se debe estimar primero la mdia poblacional. La media de todos los valores muestrales proporciona esa estimación. Después, se determina la diferencia entre la media de cada grupo y esta media poblacional estimada, y estas diferencias se elevan al cuadrado y se suman. Este valor, con frecuencia se llama la suma de cuadrados entre (SCb). Esta suma se divide entonces entre el número adecuado de grados de libertad para obtener la estimación de la varianza de la distribución muestral. La ecuación siguiente da el cálculo de la estimación de la varianza de la distribución muestral de las medias:

2271.gif
Donde

2272.gif

Para la distribución muestral de las medias 2273.gifen donde n es el tamaño de la muestra o  el número de elementos de cada grupo. Al evaluar esta ecuación para una estimación de la varianza  2274.gifse obtiene:

2275.gif

Se puede calcular una estimación de  2 si se multiplica n por la estimación de  si se multiplica n por la
estimación de 2276.gif , es decir;
2278.gif

La estimación del método entre de la varianza se puede calcular si se sustituye el valor de la ecuación anteriormente explicada por 2276.gif
2279.gif

Donde:

2280.gif

El valor adecuado de los grados de libertad para el método entre es c-1.
como la media global se resta de la media de cada grupo, sólo (c-1) medias pueden variar. Observe que la ecuación anteriormente descrita, supone que el número de observaciones en cada grupo, n, es el mismo.

EJEMPLO



En el ejemplo anterior al de antes, se obtuvo una muestra de los pesos de llenado de cuatro paquetes de espinacas congeladas de tres contenedores y se calculó una estimación de la varianza poblacional desconocida con el método dentro. En este ejemplo, la varianza poblacional desconocida se estimará mediante el método entre:

(12,0 - 11,4)2 + (11,0 - 11,4)2 + (11,2 -11,4)

2281.gif

La estimación de la varianza poblacional, calculada con el método entre es 1,12.

- TABLA Y PRUEBA F PARA ANOVA


Una vez que se ha usado el método dentro y entre, para estimar la varianza desconocida de las poblaciones, se forma un cociente con estas dos estimaciones:
2282.gif

Si la hipótesis nula es cierta, tanto el numerador como el denominador de la ecuación son estimaciones válidas de la varianza común de las poblaciones que se estudian. Este cociente se ajusta a la distribución F. Si la hipótesis nula es falsa el numerador de la ecuación en realidad es una estimación inflada de  2; el denominador sigue siendo una estimación válida. Bajo estas condiciones, el valor F será muy grande, y se puede concluir que la hipótesis  nula es falsa. La figura que mostramos a continuación presenta la distribución muestral para la prueba ANOVA junto con las regiones de aceptación y rechazo.
La siguiente figura ilustra el paso final de la prueba de hipótesis ANOVA. Si la hipótesis nula de medias poblacionales iguales es cierta, el estadístico F calculado se obtuvo de esta distribución; esto parece razonable siempre que el valor F no sea demasiado grande. De los datos muestrales resulta un valor F muy grande, se concluye que medias poblacionales diferentes son las causas de que el numerador en el cálculo de F esté inflado, y la hipótesis nula se rechaza. En la figura siguiente se puede observar que alfa ( ), la probabilidad de un error tipo I se indica en la cola superior. Si la hipótesis nula es en realidad cierta existe alguna posibilidad de que equivocadamente se declare falsa. La probabilidad de que esto ocurra es alfa ( ), es decir, el nivel de significancia de la prueba.

2283.gif

- TABLA ANOVA



Los resultados del análisis de varianza se presentan en una tabla ANOVA que resume los valores importantes de la prueba. Esta
tabla tiene un formato estándar que usan los libros y los problemas de computadora que ejecutan ANOVA. La siguiente tabla muestra la forma general de la tabla ANOVA.

En dicha tabla se resumen los cálculos necesarios para la prueba de igualdad de las medias poblacionales usando análisis de
varianza. Primero se usa el método dentro para estimar  2 .Cada valor de los datos se compara con us propia media, y la suma de las diferencias al cuadrado se divide entre los grados de libertad c(n-1).

2284.gif

Donde:

- j = Número de la columna
- i = Número de la fila
- c = Número de columnas (grupos)
- n = Número de elementos en cada grupo (tamaño de la muestra)

La tabla ANOVA contiene columnas con las fuentes de variación, las sumas de cuadrados, los grados de libertad, las
estimaciones de la varianza y el valor F para el procedimiento de análisis de varianza.

EJEMPLO



Una analista de una cadena de supermercados, quiere saber si las tres tiendas tienen el mismo promedio en dólares por compra. Se elige una muestra aleatoria de seis compras en cada tienda. La tabla número 1 presenta los datos recolectados de esta muestra junto con las medias maestrales para cada tienda

y la media global de todos los datos. Hará una prueba con un nivel de significancia de 0,01.
La hipótesis nula que se quiere probar es que todas las poblaciones de las que se obtuvieron los datos maestrales tienen la misma media. La hipótesis alternativa es que las poblaciones no tienen la misma media. Las primeras dos medias maestrales  en la tabla número 1 sugieren que la hipótesis nula es cierta, ya que son muy cercanas. La tercera media muestral, es considerablemente mas pequeña que las otras dos. Pero, ¿Se debe esta diferencia a la aleatoriedad del muestreo o al hecho de que las poblaciones tienen medias distintas? Esta es la pregunta que vamos a responder con el procedimiento de ANOVA.

Tabla número 1 ‘ Datos maestrales para ANOVA (en dólares) para el ejemplo

2284.gif
Tienda 1  Tienda 2     Tienda 3
——————————————–
12,05              15,17        9,48
23,94              18,52          6,92
14,63              19,57        10,47
25,78              21,40        7,63
17,52              13,59        11,90
18,45              20,57        5,92

Media    18,73              18,14        8.72

Media global  :   x = 15,20,           c=3,         n=6

Se usan ambos métodos, dentro y entre, para estimar la varianza de las tres poblaciones. Recuerde la suposición fundamental de ANOVA :  todas las poblaciones tienen la misma varianza sin importar si tienen la misma media. La tabla número 2 contiene los cálculos para el método dentro, y la tabla número 3 da los cálculos para el método entre.

Tabla número 2 ‘ Cálculos del método dentro para el ejemplo.

Tienda 1 ‘ (12,05 - 18,73)2 + (23,94 - 18,73)2 + (14,63 - 18,73)2 + (25,78 - 18,73)2 + (17,52 - 18,73)2 + (18,45 - 18,73)2 = 139,82
Tienda 2 ‘ (15,17 - 18,14)2 + (18,52 - 18,14)2 + (19,57 - 18,14)2 + (21,40 - 18,14)2 + (13,59 - 18,14)2 + (20,57 - 18,14)2 = 48,25
Tienda 3 ‘ (9,48 - 8,72)2 + (6,92 - 8,72)2 + (10,47 - 8,72)2 + (7,63 - 8,72)2 + (11,90 - 8,72)2 + (5,92 - 8,72)2 = 26,02
Suma de cuadrados dentro (SCw)  = 139,82 + 48,25 + 26,02 = 214,09

Tabla número 3 ‘ Cálculos del método entre para el ejemplo.

(18,73 - 15,20)2 + (18,14 - 15,20)2 + (8,72 - 15,20)2 = 63,09

Suma de los cuadrados entre (SCb) = 6(63,09) = 378,54

Los valores calculados en las tablas 2 y 3 se usan para rellenar la tabla ANOVA. Como se tienen tres poblaciones en la prueba,
c = 3. Se obtuvo una muestra de seis valores de cada población, así que n = 6. La tabla número cuatro presenta la tabla ANOVA para este ejemplo.

Tabla número 4 ‘ Tabla ANOVA para el ejemplo.

2285.gif

Los grados de libertad se calcularon como sigue:

- c- 1 = 3 - 1 = 2 (Grupos entre)
- c (n - 1) = 3 ( 6 - 1 ) = 15 (Grupos dentro)

Como se puede ver en la tabla número 4, el método entre para estimar  2, produce un valor de 189,27, mientras que la estimación
del método dentro es de 14,27. El cociente F indica que la estimación del método ente es 13,26 veces el valor del método dentro. ¿Se debe esta diferencia al error de muestreo, o se debe a que la hipótesis nula es falsa?. Para contestar a esta pregunta se consulta la tabla F y se determina un valor crítico.
Dos grados de libertad están asociados con el numerador del cociente de F , y se asocian quince grados de libertad con el denominador. De la tabla F  el valor crítico es 6,36 para estos grados de libertad a un nivel de significancia de 0,01. El valor F calculado de 13,26 es mayor que el valor crítico, lo que significa que se tiene suficiente evidencia muestral para rechazar la hipótesis nula de medias poblacionales iguales.

EJEMPLO 2



Se pide a cuatro personas que beben una marca determinada de café que registren el número de tazas que consumen durante un día. Se hace lo mismo con bebedores de otras marcas. Los resultados se muestran a continuación. Construya la tabla ANOVA para probar si existe alguna diferencia en el número promedio de tazas consumidas, para cada marca.

2286.gif

Media global ‘ 4.25
n = 4
c = 4

METODO DENTRO



- Marca A ‘ (3 - 4)2 + (2 - 4)2 + (5 - 4)2 + (6 - 4)2 = 10
- Marca B ‘ (5 - 4)2 + (1 - 4)2 + (5 - 4)2 + (6 - 4)2 = 17
- Marca C ‘ (2 - 6)2 + (10 - 6)2 + (5 - 6)2 + (7 - 6)2 = 34
- Marca D ‘ (3 - 3)2 + (6 - 3)2 + (4 - 3)2 + (5 - 3)2 = 14

METODO ENTRE



4 - 4,25)2 + (4 - 4,25)2 + (6 - 4,25)2 + (3 - 4,25)2 = 6,75

TABLA ANOVA


2287.gif

ANALISIS DE LA VARIANZA CON DOS CRITERIOS DE CLASIFICACIÓN



Anova con dos criterios


En ocasiones, es deseable identificar dos causas posibles para las diferencias en la variable dependiente. Si es el caso, se lleva a cabo un programa ANOVA con dos criterios de clasificación, donde se identifican dos causas posibles para la variabilidad de la variable dependiente. Se toman al azar dos muestras de la población de interés y se usan los resultados maestrales para probar la hipótesis nula relevante.

EJEMPLO



Hace un par de ejemplos, el analista intentó determinar si había alguna diferencia en el promedio en dólares por compra entre tres tiendas. ¿ Qué ocurre si también quiere determinar si existe alguna diferencia en el promedio de compra debida a los efectos de dos campañas distintas de publicidad ?
Los datos de la tabla número 1 del ejemplo del que estamos tratando se vuelven a disponer de manera que se puedan examinar usando dos criterios de clasificación para el análisis de varianza. Hay tres grupos en el factor 1 (tiendas) y dos grupos en el factor 2 (campañas de publicidad). Se tomó una muestra de tres elementos (n=3) y se tomaron medidas para cada una de las seis celdas de la tabla (3 *2 = 6).

Tabla número 5 ‘ Datos maestrales (dólares) de ANOVA para el ejemplo.

22871.gif

Media global ‘ 15,20            r = 2            c=3            n=3

- Media tienda 1 ‘  18,73
- Media tienda 2 ‘ 18,14
- Media tienda 3 ‘ 8,72
- Media campaña A ‘ 14,53
- Media campaña B ‘ 15,86
- Media  tienda 1 y campaña A ‘ 16,87
- Media tienda 2 y campaña A ‘ 17,75
- Media tienda 3 y campaña A ‘ 8,96
- Media tienda 1 y campaña B ‘ 20,58
- Media tienda 2 y campaña B ‘ 18,52
- Media tienda 3 y campaña B ‘ 8,48





Creative Commons License
Estos contenidos son Copyleft bajo una Licencia de Creative Commons.
Pueden ser distribuidos o reproducidos, mencionando su autor.
Siempre que no sea para un uso económico o comercial.
No se pueden alterar o transformar, para generar unos nuevos.

 
TodoMonografías.com © 2006 - Términos y Condiciones - Esta obra está bajo una licencia de Creative Commons. Creative Commons License