EST_1415_Practica4

935 days ago by sevillad1415

Práctica 4 de Estadística

 

Límite de entrega de esta práctica: ver tarea en Moodle o calendario de la asignatura. Hasta una semana de retraso: vale hasta el 50%. Más de una semana de retraso: no cuenta para la nota.

Instrucciones:

  1. Haz una copia de la hoja pública y renómbrala: si tu correo es usuario@alumnos.unex.es añade al final del título _usuario, por ejemplo EST_1415_Practica2_sevillad.
    • Para cambiar el nombre pulsa en el título de la hoja (arriba del todo, entre el logo de Sage y el menú "File...")
  2. Comparte la hoja de trabajo con el usuario sevillad1415 mediante el botón Share de arriba a la derecha.
  3. Trabaja la práctica: los ejercicios marcados "opcional" son solo para subir nota.
  4. Cuando hayas terminado, haz una copia en un único fichero PDF y ponlo en el campus virtual. Esa será la versión que se evaluará. La hoja no se considera entregada si no se ha compartido (punto 2).
    • Para generar el PDF lo más sencillo es usar el botón Print de arriba e imprimir la nueva página a fichero.
    • Una alternativa es hacer capturas de pantalla (JPG, PNG...) de la hoja a imprimir, y convertirlas a PDF uniendo después los distintos ficheros generados.
  5. Ve al campus virtual, al registro de horas no presenciales, y pon allí las dedicadas a esta práctica (recuerda descontar las presenciales de laboratorio), indicando en "observaciones" la actividad.

 

 

Veamos cómo usar Sage para trabajar con las distribuciones vistas en clase. Como sabes, Sage está construido usando Python, y lo que haremos será importar un par de módulos para hacer cálculos estadísticos y dibujar las distribuciones.

Empezamos por la distribución binomial. Los parámetros son el número de intentos y la probabilidad de éxito de cada uno. La variable "x" contiene los posibles valores, e "y" contiene las probabilidades de esos valores.

import scipy.stats import matplotlib.pyplot as plt n,p = 10,0.5 v = scipy.stats.binom(n,p) print "Media =", v.mean() print "Varianza =", v.var() x = [0..n] y = v.pmf(x) fig = plt.figure(figsize=(5,5)) ax = fig.add_subplot(111) ax.plot(x, y, 'bo') ax.vlines(x, 0, y, lw=2) ax.set_xlabel('i') ax.set_ylabel('P') plt.savefig('Histogram.png') plt.close() 
       
Media = 5.0
Varianza = 2.5
Media = 5.0
Varianza = 2.5

La variable "v" contiene la distribución, y tiene muchos métodos. Por ejemplo hemos usado ".mean" y ".var" para calcular la media y la varianza. Otra cosa interesante es obtener fácilmente una lista con valores de la variable, como a continuación.

[v.rvs() for i in [1..20]] 
       
[6, 5, 5, 6, 5, 4, 5, 4, 3, 7, 3, 7, 4, 4, 6, 7, 4, 7, 4, 5]
[6, 5, 5, 6, 5, 4, 5, 4, 3, 7, 3, 7, 4, 4, 6, 7, 4, 7, 4, 5]

Para una distribución hipergeométrica ponemos como parámetros N, K y n.

import scipy.stats import matplotlib.pyplot as plt N,K,n = 100,25,12 v = scipy.stats.hypergeom(N,K,n) print "Media =", v.mean() print "Varianza =", v.var() x = [0..n] y = v.pmf(x) fig = plt.figure(figsize=(5,5)) ax = fig.add_subplot(111) ax.plot(x, y, 'bo') ax.vlines(x, 0, y, lw=2) ax.set_xlabel('i') ax.set_ylabel('P') plt.savefig('Histogram.png') plt.close() 
       
Media = 3.0
Varianza = 2.0
Media = 3.0
Varianza = 2.0

La distribución geométrica funciona de manera ligeramente distinta a lo visto en clase: no cuenta el número de fallos hasta acertar, sino el número de intentos, que es uno más (como en los apuntes). El parámetro de una distribución geométrica es la probabilidad de éxito de cada intento.

Fíjate en el ejemplo siguiente para entender la diferencia entre contar fallos y contar intentos.

import scipy.stats import matplotlib.pyplot as plt p = 0.25 v = scipy.stats.geom(p) print "Media =", v.mean() print "Varianza =", v.var() n = 10 x = [1..n] y = v.pmf(x) fig = plt.figure(figsize=(5,5)) ax = fig.add_subplot(111) ax.plot(x, y, 'bo') ax.vlines(x, 0, y, lw=2) ax.set_xlabel('i') ax.set_ylabel('P') plt.savefig('Histogram.png') plt.close() 
       
Media = 4.0
Varianza = 12.0
Media = 4.0
Varianza = 12.0

La distribución binomial negativa funciona como en clase, de manera ligeramente distinta a los apuntes. Los parámetros son el número de aciertos que se buscan y la probabilidad de acierto en cada intento. Los valores de la distribución son el número de fallos hasta conseguir los aciertos buscados, es decir, un número mayor o igual que cero. En ese sentido la definición no concuerda con la de distribución geométrica.

# nbinom.pmf(k) = choose(k+n-1, n-1) * p**n * (1-p)**k import scipy.stats import matplotlib.pyplot as plt n,p = 4,0.2 v = scipy.stats.nbinom(n,p) print "Media =", v.mean() print "Varianza =", v.var() x = [0..40] y = v.pmf(x) # print (1-p)*n/p fig = plt.figure(figsize=(5,5)) ax = fig.add_subplot(111) ax.plot(x, y, 'bo') ax.vlines(x, 0, y, lw=2) ax.set_xlabel('i') ax.set_ylabel('P') plt.savefig('Histogram.png') plt.close() 
       
Media = 16.0
Varianza = 80.0
Media = 16.0
Varianza = 80.0

Finalmente, la distribución de Poisson depende de un parámetro de manera obvia.

import scipy.stats import matplotlib.pyplot as plt l = 4 v = scipy.stats.poisson(l) print "Media =", v.mean() print "Varianza =", v.var() x = [0..20] y = v.pmf(x) # print (1-p)*n/p fig = plt.figure(figsize=(5,5)) ax = fig.add_subplot(111) ax.plot(x, y, 'bo') ax.vlines(x, 0, y, lw=2) ax.set_xlabel('i') ax.set_ylabel('P') plt.savefig('Histogram.png') plt.close() 
       
Media = 4.0
Varianza = 4.0
Media = 4.0
Varianza = 4.0
 
       

Ejercicio 1. La probabilidad de que un bit se transmita erróneamente es de $10^{-9}$. En un paquete de 1024 bits, hasta 5 errores son corregibles. ¿Qué proporción de paquetes no son aceptables? Si se transmiten 2000 paquetes por minuto, ¿cuál es la probabilidad de que haya algún paquete fallido en un minuto?

 
       

Ejercicio 2. Toma una distribución hipergeométrica $X$ con parámetros que no sean muy pequeños. Usa la desigualdad de Chebyshev con un valor de $k>2$ que elijas. ¿Qué intervalos sale y qué probabilidad le asigna la desigualdad? Ahora calcula la probabilidad exacta de que $X$ esté en ese intervalo. Finalmente, haz una simulación con muchos valores de $X$ y comprueba si la proporción se parece a lo que predice la desigualdad o a la probabilidad exacta que has calculado después.

 
       

Ejercicio 3. Abel y Berto juegan al ping-pong. Abel es un poco mejor: tiene una probabilidad de 0.51 de ganar cada punto. Si juegan 21 puntos, ¿cuál es la probabilidad de victoria de Abel?

 
       

Ejercicio 4. ¿Cuántas cartas de una baraja española hay que sacar en promedio para tener los cuatro ases?

 
       

Ejercicio 5. Un vendedor por teléfono tiene una probabilidad del 0.02 de vender su producto en cada llamada que hace. Cada llamada que termina en venta dura 10 minutos y cada llamada que no termina en venta dura 2 minutos. ¿Cuál es la probabilidad de que tarde menos de 8 horas en conseguir 4 clientes?

 
       

Ejercicio 6. Dos personas juegan a cara o cruz hasta que alguien llegue a 10 victorias. Si el marcador en un momento dado es 8-6, ¿qué probabilidad tiene cada persona de ganar?

 
       

Ejercicio 7. ¿Cuántas veces en promedio tenemos que tirar un par de dados para conseguir que sumen 7? ¿Y para que pase 2, 3 y 4 veces?