Monografías
Publicar | Monografías por Categorías | Directorio de Sitios | Software Educativo | Juegos Educativos | Cursos On-Line Gratis

 

Estadística - Monografía



 
DESCARGA ESTA MONOGRAFÍA EN TU PC
Esta monografía en formato html para que puedas guardarla en tu pc e imprimirla.



Vínculo Patrocinado




Aquí te dejamos la descarga gratuita
Nota: para poder abrir archivos html solo necesitas tener instalado internet explorer u otro navegador web.




Distribución binomial. Correlación. Nube puntos. Centro gravedad. Covarianza. Método mínimos cuadrados. Regresión. Valor estimado. Tabla doble entrada



NUBES DE PUNTOS. CORRELACIÓN



Éstas son las notas de 12 estudiantes en Matemáticas y en Física:
100875.gif

Es una distribución bidimensional porque a cada individuo le corresponden los valores de dos variables. Si tomamos esos dos valores como las coordenadas de un punto, la distribución puede ser representada mediante 12 puntos: nube de puntos.

Se aprecia una relación entre las dos variables: a mejor nota en Matemáticas mejor nota en Física, pero solo a grandes rasgos, grosso modo. Se dice que existe correlación entre esas dos variables.

Relacionemos ahora las notas de Matemáticas de los mismos alumnos con las de otra asignatura, Filosofía.

100876.gif

Tanto si nos fijamos en la tabla de datos como en la nube de puntos, apreciamos que también hay correlación entre estas dos variables, pero es más débil que la anterior.

Una jugadora de baloncesto lanza a canasta, desde distintas distancias, 10 balones cada vez. Lógicamente, encesta más cuanto más cerca está.
100877.gif

En este caso hay correlación fuerte y negativa, pues al aumentar una variable tiende a disminuir la otra.

La tendencia a variar conjuntamente las dos variables en una distribución bidimensional se marca mediante la recta de regresión. Cuanto más próximos estén los puntos a la recta, más fuerte es la correlación.

MEDIDA DE LA CORRELACIÓN



Hemos visto que la correlación entre dos variables (más o menos fuerte, positiva o negativa) se aprecia mediante el grado de “apertura” de los puntos de la nube. Vamos a confeccionar una fórmula que sirva para obtener su valor de forma numérica e inequívoca.

Centro de gravedad de una distribución bidimensional


100878.gif

El punto  se llama centro de gravedad de la distribución.

Covarianza


100879.gif

Correlación


100880.gif

El coeficiente de correlación, r, tiene las siguientes propiedades:

No tiene dimensiones. Es decir, no depende de las unidades en las que se expresan los valores de las dos variables. Por tanto, si se realiza un cambio de unidades, el valor de r no varía.

El valor de r está comprendido entre -1 y 1.

- Si la correlación es perfecta (puntos de la nube alineados), entonces | r | = 1, es decir, r = 1 ó r = -1.
- Si la correlación es fuerte, | r |  es próximo a 1.
- Si la correlación es débil,  | r |  es próximo a 0.


EJERCICIOS RESUELTOS


Utilizando la fórmula anterior, calcular la correlación entre las variables nota en Matemáticas, x, nota en Física, y. Para ello, calcular previamente 100881.gif

100882.gif

El centro de gravedad es el punto (6,5). Observamos que este punto no tiene por que ser de le distribución.
Por tanto,
100883.gif
Es una correlación muy alta.

Método de los mínimos cuadrados


Partimos de la nube de puntos  .

Hemos de encontrar la recta que “mejor se ajuste” a la nube.

¿Qué criterio seguimos para ese “mejor ajuste”?

Consideramos todas las posibles rectas y =A+Bx y nos quedaremos con aquella para la cual los cuadrados de las distancias,  , sumen lo menos posible:  100884.gif mínimo.

De ese modo se llega (utilizando métodos matemáticos superiores a este curso) a lo siguiente:

-  La recta buscada pasa por el centro de gravedad 100885.gif  de la distribución.

- Su pendiente es   100886.gif

100887.gif

El signo del coeficiente de correlación y el del coeficiente de regresión coinciden, pero aquí termina la coincidencia: puede ser que la recta de regresión tenga pendiente alta y, sin embargo, el coeficiente de correlación sea bajo. O al contrario.

EJERCICOS RESUELTOS



1. En la distribución Notas de Matemáticas-Notas de Física, cuyos parámetros hemos calculado en la página anterior, obtener la recta de regresión de  Y  sobre  X.

100888.gif
La recta de regresión para hacer estimaciones

La recta de regresión se amolda a la nube de puntos y describe, a grosso modo, su tendencia. Por eso, a partir de la recta de regresión obtenemos, de forma aproximada, el valor esperado de  y  para un cierto valor de  x, o viceversa. A estos valores se les llama estimaciones.
100889.gif

- Las estimaciones siempre se realizan aproximadamente y en términos de probabilidad [es probable que si   entonces y valga, aproximadamente,   ].
- La aproximación es tanto mejor cuanto mayor sea  | r |, pues para valores de  r  próximos a 1 o a -1, los puntos están muy próximos a la recta.
- Las estimaciones sólo deben hacerse dentro del intervalo de valores utilizados o muy cerca de ellos.

EJERCICIOS RESUELTOS



1. La tabla adjunta da los alargamientos de una barra metálica por efecto de cambios en la temperatura. Calcular la recta de regresión y hacer algunas estimaciones.

100890.gif 100891.gif

HAY DOS RECTAS DE REGRESIÓN



Como ya hemos dicho, la recta de regresión obtenida  100892.gif es la recta de regresión de  Y  sobre  X.

Si el criterio que siguiéramos para ajustar la recta a la nube de puntos fuera hacer mínima la suma de los cuadrados de las diferencias de abscisas del punto y de la recta ( mínimo) obtendríamos otra recta llamada recta de regresión de  X  sobre  Y.
100893.gif

Posiciones de las dos rectas de regresión



Cuando la correlación es casi nula, las dos rectas forman un ángulo muy grande (próximo a 90º):
Si la correlación es fuerte, el ángulo que forman las dos rectas es pequeño:
Si | r | es próximo a 1, las rectas son casi coincidentes:

TABLAS DE DOBLE ENTRADA



Recordemos que las distribuciones de una variable, cuando el número de observaciones e pequeño, se dan, simplemente, enumerando los datos de forma ordenada. Pero cuando el número de datos es grande, se recurre a la tabla de frecuencias.

Del mismo modo, en las distribuciones bidimensionales, cuando hay pocos pares de valores se procede como hemos hecho hasta ahora: enumerándolos. Si algún par está repetido, se pone dos veces.

Pero cuando el número de datos es grande, se recurre a las tablas de doble entrada:

En cada casilla se pone la frecuencia correspondiente al par de valores que definen esa casilla. Por ejemplo, hay 11 individuos para los cuales x =0, y =1. Es decir, el par (0,1) está 11 veces.

La representación gráfica de estas distribuciones se hace:

Hinchando los puntos proporcionalmente a su frecuencia.

100894.gif

O bien levantando barras de altura proporcional a la frecuencia de cada casilla.

100895.gif

 CUESTIÓNES TEÓRICAS



20. ¿Qué punto tienen en común las dos rectas de regresión? El centro de gravedad.

21. ¿Qué condición debe cumplir r para que las estimaciones hechas con la recta de regresión sean fiables? Que el valor este comprendido entre 1 y -1.

22. Prueba que el producto de los coeficientes de regresión   y    es igual al cuadrado del coeficiente de correlación.
100896.gif

23. De una distribución bidimensional (x, y) conocemos los siguientes resultados:
- Recta de regresión de Y sobre X:
y = 8,7-0,76x
- Recta de regresión de X sobre Y:
y = 11,36-1,3x

a)    Calcula el centro de gravedad de la distribución.
b)    Halla el coeficiente de correlación.

 


Autor:

Chusky





Creative Commons License
Estos contenidos son Copyleft bajo una Licencia de Creative Commons.
Pueden ser distribuidos o reproducidos, mencionando su autor.
Siempre que no sea para un uso económico o comercial.
No se pueden alterar o transformar, para generar unos nuevos.

 
TodoMonografías.com © 2006 - Términos y Condiciones - Esta obra está bajo una licencia de Creative Commons. Creative Commons License