5ª Sesión: se acabó lo que se daba.

     Buenas, vamos a por al última sesión del tema, quizá la menos importante ( fijaros que en los ejercicios resueltos del final no hay ninguno). Hablamos de los puntos 5 y 6, pero sobretodo de este último.

Punto 5: Recta de regresión de X sobre Y

     Este punto quedó claro ayer, creo. Página 218.Se trata de que si quiero hallar la recta de regresión de X sobre Y ( y no la de Y sobre X), pues aplico la misma fórmula, pero cambiando las letras: es decir, donde pone media de y pongo media de x, en lugar de la media de x la media de y y en vez de la varianza de x, pues la varianza de y. Lo tenéis en el recuadro amarillo.

    Esto se debe a que cuando quiero hacer predicciones, construiré la recta que me convenga. Imaginad una Distribución bidimensional que relaciona peso(X) y altura (Y). Si quiero predecir la altura sabiendo un peso, pues necesito la fórmula que me da la y cuando sé la x, es decir, la recta de regresión de Y sobre X. O al revés, si quiero el peso sabiendo la altura, construyo la de X sobre Y, para meter la altura (y) y sacar el peso (X).

    Lo que os cuenta debajo son dos cosas, que pueden caer en ejercicios.

  1.  Cuanto más "pegadas" estén las rectas, más correlación hay, pues al estar más pegados los puntos, más se "parecerán" las rectas. Si están muy "perpendiculares", es que no hay casi correlación.
  2. Recordad que las rectas de regresión pasan por lo que llamamos el centro de gravedad, que viene dado por las coordenadas. (media de x, media de y). Entonces, las dos rectas (Y sobre X y X sobre Y ) han de pasar por ese punto. Vamos que si me dan dos rectas, y quiero saber si son las dos de regresión de mi distribución, resuelvo el sistema y veo si la solución es la media de x y la media de y. Y si quiero saber si están relacionadas, su coeficiente de regresión ( el número que va delante de la letra en la fórmula) debe ser parecido , para que tengan la misma inclinación. Os pongo un ejemplo en la foto.
Deberes:1 a) b) de la 218//1 de la 219

Punto 6: Tablas de Contingencia

        Como os digo, he encontrado pocos ejercicios sobre este punto, además de que es el más lioso. Pero sin miedo, vamos allá, página 219.

        Os miráis la primera tabla de la página, que relaciona a 500 personas según su rango de edad (variable X) y sus gustos televisivos ( variable Y). Si yo pienso sólo en la variable X, pues de 18 a 25 hay  50 ( sumados todos los que les gusta los informativos, los documentales, etc...) .Consiste en mirar al final de la columna de 18-25 Es la segunda tabla que veis, y se le llama Distribución marginal de X.. Y lo mismo podéis hacer con la variable Y, viendo a cuanto gente le gusta los informativos, sumando los de 18-25, los de 26-35.

      Cada una de esas distribuciones pues tiene sus parámetros: media, desviación típica, varianza(elevar al cuadrado la desviación típica) , etc.. si es numérica.  Me explico: no puedo calcular la media de los gustos, porque es informativo, documental,etc.. Si puedo calcular la media de edad de la gente que ha participado en la encuesta(variable X). ¿Cómo? Multiplicando la mitad de cada intervalo por su frecuencia absoluta. Vuelvo a explicarme: De 18 a 25 hay 50, pues 50 x 21'5, que es la mitad de 18 a 25 (basta sumar y dividir por dos).

      Girad la página. Las dos últimas cosicas:

Distribuciones condicionadas: Es el ejemplo que veis primero. Yo puedo preguntarme los gustos televisivos si sé que se tiene mas de 65 años, y me sale otras dos columnitas, etc... ¿Fácil, no? Consiste en fijarse en la columna que nos dicen. Y si nos preguntan por la edad sabiendo el gusto televisivo, pues nos fijamos en la fila y au.

Variables independientes. Lo último que entra ( la siguiente página me parece raro y chungo que entre, si lo vemos ya haremos algo). Si las frecuencias relativas de la distribución marginal y de la condicionada coinciden, se dice que son variables independientes . La habéis flipado, ¿eh?
Como si hablo chino, ¿verdad? no, en serio, es fácil. Fijaros en el ejemplo, mirando la tabla de arriba a la izquierda. Mirad la gente que le gusta el deporte, toda sumada, 200. entonces, de 18 a 25 que le guste el deporte,habrá 20 de 200, 20/200, 0'10. y así construye toda la primera fila de la segunda tabla que veis. Pues si esto coincide con la marginal , es decir, la última fila ( 50 de 500, etc...) se dice que son independientes. Vamos que coinciden las dos columnas verdes que os he subrayado en el tema

Sé que esto es raro y fastidiado, pero es , como yo le llamo, el "por si acaso".

Deberes:3 de la 220// 3 de la 226//17,18 y 19 de la 228 ( como mega repaso)



Sé que es bastante, pero los primeros son súper rápidos, y los 3 de la 228 son como un estudio global para mañana. Es un apretón y os lo quitáis de en medio.

Ánimo y un placer haberos ayudado

Comentarios