AJO_1819_Practica3

126 days ago by sevillad1819

Práctica 3 de AJO 2018-19

Límite de entrega de esta práctica: ver tarea en Moodle o calendario de la asignatura. Hasta una semana de retraso: vale hasta el 50%. Más de una semana de retraso: no cuenta para la nota.

Instrucciones:

  1. Haz una copia de la hoja pública y renómbrala: si tu correo es usuario@alumnos.unex.es añade al final del título _usuario, por ejemplo CAv_1314_Practica7_sevillad.
    • Para cambiar el nombre pulsa en el título de la hoja (arriba del todo, entre el logo de Sage y el menú "File...")
  2. Comparte la hoja de trabajo con el usuario sevillad1819 mediante el botón Share de arriba a la derecha.
  3. Trabaja la práctica.
  4. Cuando hayas terminado, haz una copia en un fichero PDF y ponlo en el campus virtual. Esa será la versión que se evaluará. La hoja no se considera entregada si no se ha compartido (punto 2).
    • Para generar el PDF lo más sencillo es usar Print arriba e imprimir la nueva página a fichero.
    • Una alternativa es hacer capturas de pantalla (JPG, PNG...) y convertirlas a un único fichero PDF.

 

A continuación vemos cómo calcular con la distribución normal estándar $X\sim N(0,1)$:

  • r.pnorm(a) calcula la probabilidad de que $X$ sea menor que a, es decir, el área desde $-\infty$ hasta a.
  • r.qnorm(b) calcula el cuantil de probabilidad b, es decir el valor de la variable que deja una región de probabilidad b a su izquierda.

En el siguiente ejemplo usamos el comando print para mostrar el resultado dentro de una frase, juntando texto y números. Como ves se separan con comas los elementos a imprimir. Fíjate también en cómo se redondea un número para quitarle cifras superfluas.

a = 0.2 p = r.pnorm(a) print "La probabilidad de X <=", a.n(digits=3), "es", p 
       
La probabilidad de X <= 0.200 es [1] 0.5792597
La probabilidad de X <= 0.200 es [1] 0.5792597

El [1] antes del resultado se debe a que estamos pidiendo a R, un conocido paquete estadístico que está dentro de Sage, que nos calcule el valor buscado (por eso la función comienza con r.). Para quitar ese "[1]" le decimos a Sage que nos devuelva el resultado en "formato Sage" aƱadiendo algo al final:

r.pnorm(a)._sage_() 
       
0.579259709439103
0.579259709439103

Si ejecutas el código siguiente tendrás un recuadro interactivo que te ayudará a entender la función.

%auto @interact def _( c = slider(-4,4,0.01,default=1,label='c') ): myplot = plot(RealDistribution('gaussian', 1), xmin=-4.001, xmax=c, aspect_ratio=5, thickness=0, figsize=7, fill='axis') myplot += plot(RealDistribution('gaussian', 1), xmin=-4, xmax=4) #myplot += text('$c$', (c+0.2,-0.03), fontsize=20) p = r.pnorm(c)._sage_() txt1 = '$Area=pnorm(%f)$' % c txt1 += '$=%f$' % p myplot += text(txt1, (1.3,0.5), fontsize=15, horizontal_alignment='left') txt2 = '$Cuantil=qnorm(%f)$' % p txt2 += '$=%f$' % c myplot += text(txt2, (1,0.4), fontsize=15, horizontal_alignment='left') #myplot += text('$Area=pnorm(%f)$' % c, (2,0.4), fontsize=15, horizontal_alignment='left') #myplot += text('$=%f$' % r.pnorm(c)._sage_(), (2.7,0.25), fontsize=15, horizontal_alignment='left') myplot.show() 
       

Click to the left again to hide and once more to show the dynamic interactive window

Para calcular cuantiles de la distribución normal estándar usamos r.qnorm. A continuación calculamos los tres cuartiles de la distribución N(0,1) usando listas como aprendimos en la práctica anterior.

cuartos = [0.25, 0.51, 0.75] [r.qnorm(p)._sage_() for p in cuartos] 
       
[-0.674489750196082, 0.0250689082587111, 0.674489750196082]
[-0.674489750196082, 0.0250689082587111, 0.674489750196082]

Ejercicio 11 (4 puntos). Demuestra numéricamente la regla 68 - 95 - 99,7 en el caso de la distribución normal estándar.

 
       
 
       

Ejercicio 12 (4 puntos). Sea una variable $X$ que sigue una distribución normal estándar.

  • Calcula la probabilidad de que $X$ sea mayor que 1.7.
  • Calcula la probabilidad de que $X$ esté entre -0.2 y 0.9.
  • Calcula el intervalo de confianza del 99% para $X$.
  • Calcula el intervalo al 99% cuyo extremo izquierdo es -2.4.
 
       
 
       
 
       
 
       

Para trabajar con distribuciones normales de parámetros arbitrarios, $N(\mu,\sigma)$, hay dos maneras:

  • Tipificando (es decir relacionando con la normal estándar).
  • Usando las funciones vistas arriba, pero con la media y la desviación típica como argumentos.

Lo más cómodo es la segunda, y lo hacemos a continuación. Ejemplo: si el valor real de una distancia es 1643.443 m y medimos con una precisión de un milímetro, la probabilidad de observar un valor menor a 1643.442 m es:

r.pnorm(1643.442,mean=1643.443,sd=0.001)._sage_() 
       
0.158655253937179
0.158655253937179

Y ahora calculemos el intervalo de confianza al 95%:

a = r.qnorm(0.025,mean=1643.443,sd=0.001)._sage_() b = r.qnorm(0.975,mean=1643.443,sd=0.001)._sage_() a,b 
       
(1643.44104003602, 1643.44495996398)
(1643.44104003602, 1643.44495996398)

Ejercicio 13 (8 puntos). Supongamos que la estatura en centímetros del alumnado del CUM siguiera una distribución $N(172,4)$.

  • Calcula la probabilidad de que un/a estudiante mida entre 163 y 169 cm.
  • Calcula la probabilidad de que un/a estudiante mida exactamente 172 cm.
  • Para hacer un equipo de baloncesto mixto queremos hacer pruebas al 2% más alto del alumnado. ¿Cuál sería la estatura mínima?
  • Para saber cuánta gente hay en ese 2%, nos pasan un dato obtenido en otro estudio: 124 estudiantes miden menos de 169 cm. ¿A cuánta gente habrá que hacer las pruebas de baloncesto?

 
       
 
       
 
       
 
       

Ejercicio 14 (4 puntos). Para medir el perímetro de una finca rectangular medimos dos lados no opuestos de manera independiente y calculamos el resultado a partir de esas dos mediciones. Las medidas de cada tramo (en m) siguen una distribución normal: $N(2144.31, 0.88)$ y $N(161.77, 0.34)$ respectivamente. Calcula intervalos de confianza al 95% para cada lado y para el perímetro.

 
       
 
       
 
       
 
       

Ejercicio 15 (8 puntos, opcional). Una empresa vende paquetes de 1 Kg de azúcar. Dado que el paquete dice "1 Kg" en la etiqueta, un paquete que tenga menos de 1 Kg de azúcar no es aceptable para el cliente (si hay más de 1 Kg no se quejará, obviamente). Sabemos que el proceso de empaquetado produce paquetes cuyos pesos (en gramos) siguen una distribución $N(1009, 4)$.

  • ¿Qué porcentaje de paquetes no son aceptables?
  • Queremos que de cada 50000 paquetes haya como mucho 1 no aceptable. Para eso vamos a usar el mismo proceso de fabricación rellenando un poco más; esto significa que aumentaremos la media pero mantendremos $\sigma=4$. ¿Qué podemos decir de esa nueva media?
  • Con el mismo objetivo de antes, queremos mejorar la precisión del proceso (reducir la desviación típica) sin cambiar $\mu=1009$. ¿Qué valores nos valen?