EST_1415_Practica6

959 days ago by sevillad1415

Práctica 6 de Estadística

 

Límite de entrega de esta práctica: ver tarea en Moodle o calendario de la asignatura. Hasta una semana de retraso: vale hasta el 50%. Más de una semana de retraso: no cuenta para la nota.

Instrucciones:

  1. Haz una copia de la hoja pública y renómbrala: si tu correo es usuario@alumnos.unex.es añade al final del título _usuario, por ejemplo EST_1415_Practica2_sevillad.
    • Para cambiar el nombre pulsa en el título de la hoja (arriba del todo, entre el logo de Sage y el menú "File...")
  2. Comparte la hoja de trabajo con el usuario sevillad1415 mediante el botón Share de arriba a la derecha.
  3. Trabaja la práctica: los ejercicios marcados "opcional" son solo para subir nota.
  4. Cuando hayas terminado, haz una copia en un único fichero PDF y ponlo en el campus virtual. Esa será la versión que se evaluará. La hoja no se considera entregada si no se ha compartido (punto 2).
    • Para generar el PDF lo más sencillo es usar el botón Print de arriba e imprimir la nueva página a fichero.
    • Una alternativa es hacer capturas de pantalla (JPG, PNG...) de la hoja a imprimir, y convertirlas a PDF uniendo después los distintos ficheros generados.
  5. Ve al campus virtual, al registro de horas no presenciales, y pon allí las dedicadas a esta práctica (recuerda descontar las presenciales de laboratorio), indicando en "observaciones" la actividad.

 

 

Para la distribución multinomial (la generalización de la binomial a varias variables), calcular las probabilidades se puede hacer simplemente con la fórmula explícita. En concreto, Si un experimento puede dar $k$ resultados diferentes, cada uno con probabilidad $p_1$, $p_2$, $\ldots$, $p_k$ respectivamente, entonces la probabilidad de que $n$ repeticiones del experimento produzcan $n_1$ resultados del primer tipo, $n_2$ del segundo, etc., es:

\[ P(X_1=n_1,\ldots,X_k=n_k) = \frac{n!}{n_1! \cdots n_k!} \ p_1^{k_1} \cdots p_k^{n_k} \]

Por ejemplo, si las probabilidades de que alguien al azar sea rubia, morena o pelirroja fueran 30%, 60% y 10% respectivamente, la probabilidad de que tomando seis personas hubiera una rubia, dos morenas y tres pelirrojas sería:

factorial(6)/factorial(1)/factorial(2)/factorial(3)*0.3^1*0.6^2*0.1^3 
       
0.00648000000000000
0.00648000000000000

Ejercicio 1. Supongamos que en una cierta ciudad la probabilidad de que alguien al azar vote a uno u otro partido es la siguiente:

  • Falange española: 1/33
  • Partido ecológico: 2/33
  • Podemos: 5/33
  • PP: 6/33
  • PSOE: 5/33
  • Abstención/Blanco/Nulo: 14/33

Se elige a 7 habitantes al azar para una encuesta.

  • ¿Cuál es la probabilidad de que cada uno de los cinco partidos reciba al menos un voto de entre las 7 personas encuestadas?
  • Calcula, para cada partido, la probabilidad de que la encuesta le pronostique una mayoría absoluta (es decir, al menos 4 de las 7 le voten).
 
       

Para calcular con una normal multivariante usemos el siguiente código, que nos permite calcular valores de probabilidad en rectángulos. Por ejemplo, para una normal con vector de medias $(1,0)$ y matriz de covarianzas $\left(\begin{array}{cc} 2 & 0.5 \\ 0.5 & 1 \end{array} \right)$, la probabilidad de que la variable caiga en el rectángulo $[-2,2] \times [-3,3]$ es:

r.library("mvtnorm") r.pmvnorm(lower=r.c(-2,-3), upper=r.c(2,3), mean=r.c(1,0), sigma=r.matrix(r.c(2,0.5,0.5,1), ncol=2))._sage_()["DATA"] 
       
0.741766771830269
0.741766771830269

Si quieres calcular probabilidades donde los rectángulos llegan hasta $\pm\infty$ en algún extremo, utiliza algún valor muy grande o pequeño para hacer una aproximación. Por ejemplo, en la distribución anterior la probabilidad de que la variable caiga en el rectángulo $[-\infty,2] \times [-3,3]$ es:

r.library("mvtnorm") r.pmvnorm(lower=r.c(-100,-3), upper=r.c(2,3), mean=r.c(1,0), sigma=r.matrix(r.c(2,0.5,0.5,1), ncol=2))._sage_()["DATA"] 
       
0.758506744188282
0.758506744188282

Ejercicio 2. Supóngase que la distribución del consumo diario en agua y calefacción, $(X,Y)$, sigue una distribución normal bivariante con medias respectivas 2 y 3 euros y matriz de covarianzas $\left(\begin{array}{cc} 1 & -0.2 \\ -0.2 & 2 \end{array} \right)$. Calcula:

  • La probabilidad de gastar entre 2 y 2.5 euros diarios en cada producto.
  • El porcentaje de personas que gastan más de 3 euros diarios en cada producto.
 
       

Ejercicio 3. En una cierta población, tanto la estatura de las madres como la de los hijos (supongamos que cada madre solo tiene un hijo) se distribuyen normalmente con 170 cm de media y 10 cm de desviación típica. Además la distribución conjunta tiene una correlación de 0.3. ¿Cuál es la proporción de parejas madre-hijo donde la madre mide al menos 12 cm más que su hijo?

 
       

Ejercicio 4. Supóngase que la distribución del consumo diario en agua y calefacción, $(X,Y)$, consiste en dos variables independientes, ambas uniformes, donde $X\in[1,3]$ e $Y\in[1,4]$. Calcula la probabilidad de gastar más de 2.5 euros en un día.

 
       

Ejercicio 5 (opcional). Comprobemos experimentalmente la respuesta a la última pregunta de la segunda ECTS: si dos variables siguen distribuciones normales, sabemos que cada una tiene una probabilidad del 50% de tomar un valor superior a su media. ¿Basta conocer la correlación entre ellas para calcular la probabilidad de que ambas sean a la vez superiores a sus medias?

  • Elige los parámetros de dos variables normales (medias y varianzas).
  • Elige un valor de correlación que no sea 0, 1 ni -1.
  • Calcula la matriz de covarianzas con esos valores, y usa el código visto arriba para calcular la probabilidad de que ambas variables tomen valores superiores a sus medias.
  • Cambia un poco los valores de las varianzas, recalcula la matriz, y recalcula la probabilidad con la nueva matriz.
  • Hazlo varias veces y observa si la probabilidad depende de las varianzas.