Monografías
Publicar | Monografías por Categorías | Directorio de Sitios | Software Educativo | Juegos Educativos | Cursos On-Line Gratis

 

Análisis de la Varianza parte 2 - Monografía



 
DESCARGA ESTA MONOGRAFÍA EN TU PC
Esta monografía en formato html para que puedas guardarla en tu pc e imprimirla.



Vínculo Patrocinado




Aquí te dejamos la descarga gratuita
Nota: para poder abrir archivos html solo necesitas tener instalado internet explorer u otro navegador web.




Interacción


Una razón más importante para aplicar el procedimiento de ANOVA con dos criterios de clasificación es que permite probar una tercera hipótesis. Como se obtendrá una muestra de cada combinación entre las variables en filas y columnas, se puede examinar el efecto de interacción de estas variables.
La interacción ocurre cuando los niveles de un factor se interrelacionan de manera significativa con los niveles del segundo factor ejerciendo influencia sobre la variable dependiente.
En el procedimiento de ANOVA con dos criterios de clasificación, la primera hipótesis nula para probar se refiere a la presencia de interacción:

H0 : No hay interacción entre los factores en las filas y los factores en las columnas para la población bajo prueba.

Si se encuentra interacción, hay que determinar porqué ciertos niveles de un factor interactúan con ciertos niveles del segundo factor. Esto se hace examinando las diferentes medias en las celdas. La interacción se encuentra pocas veces, pero cuando la hay, el analista no puede interesarse por probar otras hipótesis.
Si no se encuentra interacción, las variables en filas y columnas se examinan para buscar diferencias en la variable independiente. Las hipótesis nulas bajo prueba son:

- H0 : No existe diferencia en el valor promedio de la variable dependiente para las poblaciones en las filas.
- H1 : No existe diferencia en el valor promedio de la variable dependiente para las poblaciones en las columnas.

EJEMPLO



Un analista de personal, quiere llevar a cabo un análisis de varianza con
dos criterios de clasificación para determinar si la variable tiempo con la compañía está afectada por uno de dos factores: La localización del empleado en las áreas de trabajo de la compañía y el nivel de salario del empleado. Cada empleado se asigna a una de las cuatro áreas de trabajo de la compañía en diferentes partes de la ciudad. Existen tres tipos de empleados según el método de pago: por horas, por mes y por año. El conjunto de datos consiste en muestras de cada combinación posible entre la localización del empleado y su método de pago. Esto da como resultado una tabla de datos con 12 celdas. Las hipótesis nulas que se van a probar son:

- H0 : No hay interacción entre la localización y el método de pago.
- H0 : No hay diferencia en el tiempo con la compañía debida a la localización.
- H0 : No hay diferencia en el tiempo con la compañía debida al método de pago.

EJEMPLO



Un estudio investigó los efectos de la información respecto al precio, la
marca y la tienda sobre la evaluación del producto por los consumidores. Supongamos que la variable dependiente es la percepción del consumidor sobre la calidad del producto, medida en una escala numérica. Dos de los factores estudiados fueron precio y marca. Se tenían cinco precios para calculadoras ($17, $28, $39, $50 y la ausencia de precio) y tres marcas (Hewlett Packard , Royal y Sony). Los datos consistieron en muestras de todas las combinaciones posibles de precio y marca. Esto dio como resultado una tabla de datos con 15 celdas. Las hipótesis nulas bajo prueba son:

- H0 : No hay interacción entre el precio y la marca.
- H0 : No hay diferencia en la percepción de la calidad del producto debida a los diferentes niveles de precio.
-  H0 : No hay diferencia en la percepción de la calidad del producto debida a las diferentes marcas.

Son muchos los cálculos requeridos por un análisis de varianza con dos
criterios de clasificación. La disponibilidad generalizada de paquetes de computadora que realizan ANOVA ha eliminado prácticamente los cálculos manuales para esta técnica. Sin embargo, es importante saber que se está haciendo con los datos para lograr una interpretación y un entendimiento apropiados. Los cálculos específicos para un procedimiento de ANOVA con dos criterios de clasificación no se presentarán aquí, pero se describirá la naturaleza general del análisis y se interpretará una salida de computadora.
La suposición clave que fundamenta el ANOVA con dos criterios de clasificación es la misma que para el ANOVA con un criterio: Se supone que todas las poblaciones bajo estudio tienen la misma varianza. Si se tiene tres filas en la tabla de datos y cinco columnas, hay quince celdas y quince poblaciones que deben muestrarse. Independientemente de si las medidas de estas quince poblaciones son las mismas, debe suponerse que varían en el mismo grado. Todas deben tener la misma varianza para que el procedimiento de ANOVA funcione correctamente.
Existen cuatro formas de estimar la varianza común de las poblaciones en el procedimiento de ANOVA con dos criterios de clasificación. Una de estas formas, el método dentro, produce una estimación fiable de esta varianza independientemente de que cualquiera de las tres hipótesis nulas sean ciertas. Igual que en el procedimiento de ANOVA con un criterio, el método dentro mide la variabilidad de cada valor muestral alrededor de su propia medida de la celda. Aún cuando varias de las celdas en la tabla de datos tengan medias diferentes, esto no influirá en los cálculos de la varianza estimada con el método dentro. Al calcular la suma de cuadros usando el método entre se compara el primer dato con la media de la celda en la que está.  La diferencia se eleva al cuadrado y se suma a los cuadrados de las diferencias entre todos los otros valores de la muestra y las medias de sus propias celdas. El valor que se obtiene se divide entre el número apropiado de grados de libertad, rc(n - 1). Como la media de la celda se resta de cada uno de los n elementos en la celda,  uno de estos elementos no tiene libertad para variar. Cada celda tiene entonces (n - 1) grados de libertad, y hay r (el número de filas) multiplicado por c (el número de columnas) celdas.  Esta estimación dentro de la varianza es el denominador de cada cociente F.
El segundo método para estimar la varianza es válido solo si no hay interacción entre las poblaciones. Si la hay, este método produce una estimación inflada. El valor de gl se calcula de la misma manera que para la prueba de la tabla de contingencia: (r - 1) (c - 1).
El tercer método para estimar la varianza produce una estimación válida sólo si la hipótesis nula sobre la igualdad de la media de columnas es cierta. Si esta hipótesis es falsa, se obtendrá una estimación inflada. Esto es lo mismo que usar el método entre para estimar la varianza en un procedimiento de ANOVA con un criterio.
Los grados de libertad son el número de columnas menos uno, (c - 1).
El último método para estimar la varianza es válido sólo si la hipótesis sobre medias iguales en las filas es cierta. Si no lo es, se obtiene una estimación inflada. De nuevo, el procedimiento es similar al método entre para estimar la varianza en un ANOVA con un criterio. Los grados de libertad son el número de filas menos uno, (r - 1). La taba de a continuación contiene las fórmulas para el procedimiento de ANOVA con dos criterios de clasificación.

Tabla de análisis  de varianza con dos criterios de clasificación

2289.gif
j = Número de la columna.
i = Número del renglón.
k = Número de la observación dentro de una celda.
r = Número de filas.
c = Número de columnas.
n = Número de observaciones en cada celda.

El resultado final de un procedimiento de ANOVA con dos criterios es el cálculo de tres cocientes F. El denominador para cada uno de estos cocientes es la estimación del método dentro para la varianza desconocida de la población. Los numeradores de los cocientes son las ” estimaciones” obtenidas bajo la suposición de que cada una de las tres hipótesis es cierta. Cada cociente F se examina para ver si es muy grande.    Cualquier cociente F que sea mas grande que el valor de la tabla F da como resultado el rechazo de la hipótesis nula
correspondiente. La forma general de cada uno de los tres cocientes F es:

2290.gif

Si las tres hipótesis nulas son ciertas, los cálculos para los numeradores y denominadores de estos tres cocientes F serán estimaciones válidas de la misma varianza poblacional desconocida. Como se ha visto, una razón de este tipo se obtiene de la distribución F. Sin embargo, si cualquiera de las tres hipótesis nulas es falsa, el numerador  de la razón correspondiente estará inflado y dará un valor grande de F que llevará el rechazo de la hipótesis nula.

EJEMPLO



La siguiente tabla presenta la tabla ANOVA con dos criterios de
clasificación para el ejemplo con el que comenzamos este tema (tres tiendas). Se calcularon cuatro “estimaciones” de la varianza común de todas las poblaciones. No obstante, solo el método dentro produce una estimación válida sin importar el estado de ninguna hipótesis nula. La evidencia muestral ha producido el valor 16,019 como la estimación del método dentro para  o2.

2291.gif

Las tres hipótesis nulas son:

- H0 : No hay interacción entre tienda y campaña publicitaria en la población.
- H0 : Las poblaciones en las filas (campaña publicitaria) tienen ambas la misma medida.
- H0 : Las poblaciones en las columnas (tiendas) tienen todas las mismas medidas.

Se calculan los cocientes F de la tabla anterior dividiendo cada una de
las “estimaciones” de ?2 correspondientes a las tres hipótesis nulas entre 16,019, la estimación válida de ?2. Estos cálculos son:

2292.gif

Observe que la estimación dentro de  2 (S2w = 16,019) se usa en todos los denominadores. Además se dan los grados de libertad para el numerador y el denominador para cada prueba de hipótesis. Estos valores aparecen en la tabla anterior para cada fila de la tabla.

A continuación se encuentran las razones criticas de la tabla F calculando para interacción (0,432) es menor que el valor critico (3,88), de manera que la hipótesis nula no se rechaza. El valor F calculado para las filas (0,500) es menor que el valor critico (4,75), por lo que no se rechaza la hipótesis nula para las filas. El valor F calculado para las columnas (11,810) es mayor que el valor critico (3,88) y la hipótesis nula para las columnas se rechaza.
Las conclusiones para el análisis de varianza con dos criterios de clasificación son:
1.    No hay interacción entre tiendas y campañas publicitarias en la población.
2.    Las campañas publicitarias tienen ambas la misma media.
3.    Las tiendas tienen diferentes medias.

Para las primeras dos conclusiones existe la posibilidad de un error tipo II. En cualquier caso, la hipótesis nula puede de hecho ser falsa. Para la ultima conclusión se tiene la posibilidad de haber rechazado una hipótesis nula que en realidad es ciertas. Un paso final muy importante es la evaluación de los riegos de error y las penalizaciones asociadas.

La tercera conclusión establece que las diferentes tiendas no tienen la misma media en la población.

Vale la pena hacer algunos comentarios finales sobre los procedimientos del análisis de varianza con uno  dos criterios de clasificación. Como se ha comentado varias veces a lo largo del tema, la suposición clave de ANOVA es que todas las poblaciones tengan la misma varianza. En realidad, son tres las suposiciones que deben cumplir para que el procedimiento ANOVA arroje resultados adecuados.

1.    Todas las poblaciones que se prueban deben tener la misma varianza para la variable dependiente.
2.    Todas las poblaciones que se prueban deben seguir una distribución normal para la variable dependiente.

3.    Las muestras tomadas de las poblaciones que se prueban deben ser aleatorias.

Deben verificarse estas tres suposiciones para asegurar un análisis valido.
En ocasiones, estas suposiciones se ignoran, en particular porque los paquetes de computadora que ejecutan ANOVA no preguntan al analista si se han tenido en cuenta. El analista debe, por lo menos, tener una idea intuitiva de que se cumplen las dos primeras y que se están usando muestras aleatorias.

OTROS DISEÑOS ANOVA



Los diseños con uno y dos criterios de clasificación descritos en este capitulo constituyen los procedimientos básicos de ANOVA que se usan en la mayor parte de las aplicaciones. En ocasiones se emplean modificaciones a estos procedimientos al examinar los efectos de diferentes factores sobre una variable de interés. En esta sección se describen las cuatro variaciones básicas mas comunes.
1.    Los diseños básicos de ANOVA suponen que los tamaños de las muestras son iguales. Para el ANOVA con un criterio de clasificación se usa el mismo tamaño de muestra en cada tratamiento. En el diseño de dos criterios se usa el mismo  tamaño de muestra en cada celda de la tabla de datos. Algunos diseños mas complejos pueden manejar muestras desiguales. Esto puede ser conveniente cuando hay diferentes proporciones de los elementos de una población y el analista quiere reflejar estas diferencias en la muestra.
2.    En los diseños descritos en este tema, se muestrearon todas las poblaciones de interés. Suponga que un ANOVA con dos criterios de clasificación básicos se obtiene una muestra de todas las poblaciones. Un diseño alternativo de ANOVA elige al azar esas poblaciones para la muestra y extiende los resultados a esas poblaciones.
3.    El procedimiento básico de ANOVA se puede ampliar para cubrir tres factores o mas. Una alternativa es elegir al azar operadores (3 factores) para la muestra y extender los resultados del ANOVA a todas las poblaciones.
El estudio factorial de ANOVA con dos criterios estudiaba estos efectos. De hecho, este diseño factorial de tres criterios de clasificación obtiene una muestra de cinco niveles de precio, tres nombre de marca y tres nombres de tienda.
4.    En el diseño básico de ANOVA con un criterio de clasificación , los sujetos se asignan al azar a los tratamientos. Esta asignación aleatoria proporciona alguna seguridad de los sujetos en cada tratamiento son mas o menos los mismos, y elimina así los efectos de sujetos diferentes.
El diseño de bloques aleatorizados elimina el efecto de las diferencias entre los sujetos de los tratamientos, al someter a cada sujeto a todos estos tratamientos.

Los distintos métodos de llevar a cabo el procedimiento de análisis de varianza a veces reciben el nombre de diseños de experimentos. El término experimento sugiere una aplicación científica mas que una de negocios, y esto es cierto en general. Las aplicaciones de negocios, con frecuencia incluyen la observación mas que la manipulación de variables, así que los procedimientos avanzados de diseño o experimentos no son muy comunes. Sin embargo hay ocasiones en que la situaciones de negocios se pueden controlar para examinar el efecto de los distintos factores sobre la variable de Interés. En estos casos, los procedimientos avanzados pueden ser muy útiles y, de hecho, el control de calidad y la investigación para el diseño de productos son dos áreas de importancia en este sentido.

LA PRUEBA DE KRUSKAL-WALLIS



La estructura de los datos



Consideremos un diseño con un solo factor, completamente aleatorizado. La prueba que estudiamos es una extensión de la prueba U de Mann - Whitney para el caso de k muestras o k niveles de un factor, mutuamente independientes. Y es una alternativa al ANOVA de un factor, efectos fijos, complementos al azar, cuando no se cumplen los supuestos paramétricos del mismo.
Transformemos las n1 + n2 + … + nk = N observaciones en rangos u ordenes Oij, de modo que la menor de las Yij reciba el valor 1, la siguiente el valor 2, …, y la mayor el valor N. Si suponemos que la variable es continua no deberían existir empates.

2293.gif
Llamamos Oi a la suma de los ordenes que han correspondido a la muestra i:

2294.gif

Por tanto: 2295.gif
será la correspondiente media aritmética. La suma de los N valores valdrá_

2296.gif

Estadísticos de contraste

Podemos considerar que las k muestras son aleatorias e independientes extraidas de un población finita de tamaño N, en la cual:

2297.gif
Si las muestras proceden de una misma población o de k poblaciones idénticas, es decir, si no existen diferencias entre los tratamientos, serian mínimas las diferencias entre las medias y la media común, lo que se traducirá en valores de S pequeños. Si hay diferencias entre los tratamientos , el valor de S tendera a ser grande.
Tenemos, además según las 2 ultimas demostraciones anteriores que:

2298.gif

Si las muestras proceden de una misma población o de k poblaciones idénticas, es decir, si no existen diferencias entre los tratamientos, serian mínimas las diferencias entre las medias y la media común, lo que se traducirá en valores de S pequeños. Si hay diferencias entre los tratamientos , el valor de S tendera a ser grande.
Tenemos, además según las 2 ultimas demostraciones anteriores que:

2299.gif
Observamos que el valor esperado de S depende del numero de observaciones. Por ello, un estadístico cuyo valor esperado no depende del numero de observaciones, función de S, y con el cual llegamos a las mismas conclusiones, es:
2300.gif

2301.gif

El estadístico de contraste tiene un valor esperado que no depende del numero de observaciones; solo depende del número de muestras.
Es facil conocer su distribución muestral. Bajo la hipótesis nula, los 1,2, …,N ordenes estaran distribuidos al azar en las k muestras, con la unica restricción de que haya ni de ellos en cada una. Las distintas maneras como N elementos se pueden distribuir en k muestras de tamaño ni son:
2302.gif

Si para cada una de esas posibilidades calculamos el valor de H y llamamos a las que coincidan t(h), la posibilidad de aparacion de este valor viene dada por

2303.gif

Averiguar las probabilidades exactas para cada caso es bastante engorroso. Es mas útil servirse de una aproximación si los ni son moderadamente grandes. Para cada muestra tenemos:

2304.gif

Cuya distribución tiende a N(0,1). Por tanto si Zi2 es  12. De modo que :

2305.gif
Es la suma de k términos Zi2 ponderados, deberá seguir una distribución  2.Como se debe cumplir que:
2306.gif

no todos estos términos serán independientes, por lo que los grados de libertad serán k -1.
H es un estadístico de contraste que la sigue la distribución  2  con k -1 grados de libertad.
Si hay empates es las observaciones y se promedian los rangos, la distribución muestal de H se verá afectada. Cuantos mas empates hay, mas conservadora se hace la prueba,  lo que significa que se torna mas difícil considerar H como significativo.
Se precisa una corrección que depende exclusivamente del numero de observaciones empatadas. Si llamamos tk al numero de valores empatados en el orden k , la corrección consiste en dividir H por el siguiente termino
2307.gif

La prueba es fundamentalmente una prueba respecto a los promedios, muy poco sensible a desigualdad de las poblaciones subyacentes en sesgo, curtosis o amplitud de los datos. Es decir,  que bajo H0 de igualdad de promedios, el estadístico H tiende a ser pequeño aunque las poblaciones difieran en la forma o en las escala, lo cual implica que la probabilidad de rechazar H0  es verdadera sigue siendo próxima a alfa.

EJEMPLO:



Un psicólogo esta interesado en el efecto que determinado tipo de castigo y determinado tipo de premio tienen sobre la conducta agresiva de niños de 8 a 10 años. Con este fin,  prepara un experimento con 22 niños de esas edades tomados al azar de un colegio de EGB. Al azar los asigna a las dos condiciones experimentales y al grupo control. Al cabo de unos meses les pasa una prueba de agresividad y los obtiene los siguientes datos.

2308.gif

Se desea saber si hay evidencias suficientes para concluir que diferencia entre las medianas de los tratamientos, a nivel de significación de 0,01.

1.    Hipótesis


H0 = Las tres poblaciones subyacentes son idénticas.
H1 = Las tres poblaciones no tienen la misma mediana.

 2.    Supuestos:


a)    Las k muestras de tamaños n1,, n2 , n3 son aleatorias
b)    Las N observaciones son mutuamente independientes
c)    La variable dependiente es continua.
d)    El nivel de medida es al menos ordinal.
e)    Las poblaciones son idénticas excepto posiblemente en los promedios.

3.    Estadístico de contraste


Transformemos los datos en ordenes:
2309.gif

2310.gif

2311.gif

 4.    Zona Crítica


Puesto que un grupo tiene tamaño superior a 8 , utilizamos la distribución de  2 con 2 g.l. La zona critica estará formada por todos los valores iguales o superiores a 0.99 22 =9.21

5.    Decisión:


Puesto que 2.316 < 9.21, no podemos rechazar la hipótesis nula (p > 0.05).

6.    Conclusión


No hay evidencia suficiente en los datos para afirmar que los tratamientos tienen efecto diferencial.


RESUMEN



Además de medias y proporciones, muchas veces interesa la variabilidad de las poblaciones. En este  tema se presentaron métodos para la viabilidad de una sola población y para comparar las viabilidades de dos poblaciones.
También se presento en este tema la manera de examinar los efectos de los diferentes factores sobre la variable de interés (Variable independiente). En el análisis de varianza con un criterio, las medidas de la variable dependiente se hacen para cada nivel del factor que se piensa que afecta a esta variable. Se pueden examinar dos factores relevantes al mismo tiempo en el procedimiento de ANOVA con dos criterios de clasificación, y estudiar los efectos de tres o mas factores sobre la variable dependiente a través de procedimientos mas avanzados.
El análisis de varianza es un buen ejemplo de una técnica estadística que resulta muy practica debido al uso generalizado de las computadoras. El volumen de cálculos es tal que es muy difícil realizar un diseño de cualquier tamaño útil solo con cálculos manuales. Los programas de computadora que ejecutan ANOVA están disponibles para computadoras personales al igual que para las mas grandes. Estos programas, por lo general, realizan análisis con uno y dos criterios de clasificación y algunas veces también ofrecen técnicas mas avanzadas.

APLICACIONES DE CONCEPTO ESTADÍSTICO AL MUNDO DE LOS NEGOCIOS



Existen muchas aplicaciones de las técnicas de ANOVA presentadas a lo largo de este tema que son importantes para el mundo de los negocios. Cuando el valor promedio de alguna variable se compara con tres o mas poblaciones, las conclusiones que resultan de un estudio de ANOVA pueden ser muy  útiles para el administrador. Con frecuencia se modifican las variables de producción para determinar que combinación lleva al proceso de manufactura optimo.

EJERCICIOS



Numero 1.- Prueba de varianza con una población.



Los instrumentos científicos de medición como el altímetro de un avión, deben proporcional lecturas correctas y con errores de medición muy pequeños. El gerente de producción esta preocupado por el índice de variación en las lecturas producidas por los altímetros de su compañía. Los altímetros están diseñados para tener una desviación estándar de 200 pies. El gerente decide probar si la variabilidad de estos instrumentos es mayor que 200 pies. Selecciona una muestra de siete altímetros y calcula una desviación estándar de 250 pies.
a)    Establezca las hipótesis nula y alternativa.
b)    Calcule los grados de libertad.
c)    Establezca las reglas de decisión para un nivel de significacia de 0,05
d)    Pruebe si la variabilidad de los altímetros de la compañía es mayor que 200 pies.
2311.gif

Como el estadístico de prueba calculado (9,375) es menor al valor crítico de la tabla (12,59), la hipótesis nula no se puede rechazar a un nivel de significacia de 0,05. No existe suficiente evidencia muestral para concluir que la desviación estándar poblacional es mas de 200 pies.

Número 2.- Prueba de varianza con dos poblaciones.


Carla Mitchell, analista de los laboratorios Abbott, un fabricante nacional de medicamentos, esta preocupada por la calidad de uno de sus productos. Abbott compra el material para fabricar este producto a dos proveedores. El nivel de defectos en la materia prima es aproximadamente el mismo entre los dos proveedores, pero Carla esta preocupada por la variabilidad que existe de un embarque a otro. Si el nivel de defectos tiende a variar en forma excesiva para uno proveedor, puede afectar la calidad del medicamento. Para comparar la variación relativa de los dos proveedores, Carla selecciona 11 embarques de cada uno y mide los porcentajes de defectos  en la materia prima, junto con la desviación estándar. Los resultados son:
S1 = 0,61      n1= 11 (proveedor 1)
S2= 0,29       n2= 11 (proveedor 2)
a)    Establezca la hipótesis nula y alternativa
b)    Calcule los grados de libertad
c)    Establezca la regla de decisión para un nivel de significancia de 0,05.
d)    Prueba si la variabilidad del nivel de defectos por embarque de un proveedor 1 es mayor que para el proveedor 2.
2313.gif

Si el cociente F calculado es mayor que 2,97, se rechaza H0  (se rechaza H0 si F > 2,97)

2314.gif

Una de las varianzas muestras es 4,42 veces la otra. La hipótesis nula se rechaza porque el estadístico (2,97). Carla debe concluir que la variabilidad en los niveles de defectos de los embarques para el proveedor 1 es mayor que para los del proveedor 2.

Número 3.- Análisis de la varianza con un criterio de clasificación.



La dueña de la corporación LUZ COLOR decide reemplazar varias pinturas de aerosol. Después de investigar la situación, concluye que 4 marcas parecen comparables en términos de coste y vida útil proyectada, ella determina que el factor decisivo entre las cuatro marcas es la cantidad de pintura que se usa en la operación normal. Mide entonces el espesor de la pintura, en milímetros,  para varias pruebas , con los siguientes resultados.

2315.gif

Media Global = x = 6.88
a)    Establezca las hipótesis nula y alternativa.
b)    Calcule los grados de libertad
c)    Establezca la regla de decisión si se prueba la hipótesis nula al 0,01 de nivel de significacia.
d)    ¿ A que conclusión se llega?

a)    Las hipótesis nula y alternativa son:
H0 :  1 =  2 =  3 =  4
H1 : No todas las poblaciones tienen la misma media.

b)    Gln  = c(n - 1) = 4(6 - 1) = 20
gl2   = (c  - 1) = (4 -1) = 3
c)    Encuentra el elemento de la tabla F para la columna 3 y la fila 20. Para un nivel de significacia de 0,01 este valor crítico es 4,94. La regla de decisión es:
Si el cociente F calculado es mayor que 4,94, se rechaza la hipótesis nula ( se rechaza H0 si F > 4,94)

d)    La siguiente tabla contiene la tabla ANOVA para este problema.

2316.gif

Las sumas de cuadrados en esta tabla son:

(5,4 - 5,85)2  + (5,9 - 5,85)2 + (6,2 -5,85)2  +
(7,0 - 5,85)2  + (5,1 - 5,85)2 + (5,5 -5,85)2  +
(6,1 - 6,48)2  + (5,9 - 6,48)2 + (6,3 -6,48)2  +
(6,5 - 6,48)2  + (7,2 - 6,48)2 + (6,9 -6,48)2  +
(8,2 - 8,25)2  + (8,5 - 8,25)2 + (6,9 -8,25)2  +
(9,4 - 8,25)2  + (7,9 - 8,25)2 + (8,6 -8,25)2  +
(7,2 - 6,95)2  + (6,5 - 6,95)2 + (6,8 -6,95)2  +
(7,1 - 6,95)2  + (7,4 - 6,95)2 + (6,7 -6,95)2  +
SCn = 7,57
(5,85 - 6,88)2 + (6,48 - 6,88)2 + (8,25 -6,88)2 + (6,95 - 6,88)2  = 3,1
SCb = 6(3,1) = 18,6

2318.gif

Número 4.-

Pedro Martínez, analista de la compañía de investigaciones de mercado profesional marketing, esta llevando a cabo de un estudio para un cliente a fin de determinar si la edad y la escolaridad afectan a los ingresos percibidos. La tabla siguiente da los resultados del conjuntos de datos de Julie. ¿Cual será la conclusión de Julie si hace la prueba con un nivel de significancia de 0,05?

2319.gif

Los datos anteriores se ejecutan en un programa de computadora

Los cocientes F calculados se comparan con los valores F críticos.

2320.gif

De acuerdo con los valores críticos apropiados y los cocientes críticos de F de la anterior tabla , las tres hipótesis nulas se rechazan. Con esto como fundamento, Julie concluye que:
1.    Existe interacción entre las celdas y las escolaridad. Parece haber diferencias inesperadas cuando ciertos campos de edad se comparan con ciertos niveles de escolaridad . El rechazo de la hipótesis nula de que no hay interacción hace que Juie regrese a los datos muestrales para buscar las combinaciones  de edad / escolaridad que produjeron los resultados inesperados.
2.    Los grupos de edad tienen diferentes niveles de ingreses
3.    Los grupos de escolaridad tienen diferentes niveles de ingreses.

Autor:

Hereas





Creative Commons License
Estos contenidos son Copyleft bajo una Licencia de Creative Commons.
Pueden ser distribuidos o reproducidos, mencionando su autor.
Siempre que no sea para un uso económico o comercial.
No se pueden alterar o transformar, para generar unos nuevos.

 
TodoMonografías.com © 2006 - Términos y Condiciones - Esta obra está bajo una licencia de Creative Commons. Creative Commons License