AJO_1617_Practica3

hace 200 días por sevillad1617

Práctica 3 de AJO 2016-17

 

Límite de entrega de esta práctica: ver tarea en Moodle o calendario de la asignatura. Hasta una semana de retraso: vale hasta el 50%. Más de una semana de retraso: no cuenta para la nota.

Instrucciones:

  1. Haz una copia de la hoja pública y renómbrala: si tu correo es usuario@alumnos.unex.es añade al final del título _usuario, por ejemplo CAv_1314_Practica7_sevillad.
    • Para cambiar el nombre pulsa en el título de la hoja (arriba del todo, entre el logo de Sage y el menú "File...")
  2. Comparte la hoja de trabajo con el usuario sevillad1617 mediante el botón Compartir de arriba a la derecha.
  3. Trabaja la práctica.
  4. Cuando hayas terminado, haz una copia en un fichero PDF y ponlo en el campus virtual. Esa será la versión que se evaluará. La hoja no se considera entregada si no se ha compartido (punto 2).
    • Para generar el PDF lo más sencillo es usar Imprimir arriba e imprimir la nueva página a fichero.
    • Una alternativa es hacer capturas de pantalla (JPG, PNG...) y convertirlas a un único fichero PDF.
  5. Ve al campus virtual, al registro de horas no presenciales, y pon allí las dedicadas a esta práctica (recuerda descontar las presenciales de laboratorio), indicando en "observaciones" la actividad.

 

 

A continuación vemos cómo calcular con la distribución normal estándar $X\sim N(0,1)$:

  • r.pnorm(a) calcula la probabilidad de que $X$ sea menor que a, es decir, el área desde $-\infty$ hasta a.
  • r.qnorm(b) calcula el cuantil de probabilidad b, es decir el valor de la variable que deja una región de probabilidad b a su izquierda.

En el siguiente ejemplo usamos el comando print para mostrar el resultado dentro de una frase, juntando texto y números. Como ves se separan con comas los elementos a imprimir. Fíjate también en cómo se redondea un número para quitarle cifras superfluas.

a = 0.2 p = r.pnorm(a) print "La probabilidad de X <=", a.n(digits=3), "es", p 
       
La probabilidad de X <= 0.200 es [1] 0.5792597
La probabilidad de X <= 0.200 es [1] 0.5792597

El [1] antes del resultado se debe a que estamos pidiendo a R, un conocido paquete estadístico que está dentro de Sage, que nos calcule el valor buscado (por eso la función comienza con "r."). Para quitar ese "[1]" le decimos a Sage que nos devuelva el resultado en "formato Sage"; esto se hace así añadiendo algo al final:

r.pnorm(a)._sage_() 
       
0.579259709439103
0.579259709439103

Si ejecutas el código siguiente tendrás un recuadro interactivo que te ayudará a entender la función.

%auto @interact def _( c = slider(-4,4,0.01,default=1,label='c') ): myplot = plot(RealDistribution('gaussian', 1), xmin=-4.001, xmax=c, aspect_ratio=5, thickness=0, figsize=7, fill='axis') myplot += plot(RealDistribution('gaussian', 1), xmin=-4, xmax=4) #myplot += text('$c$', (c+0.2,-0.03), fontsize=20) p = r.pnorm(c)._sage_() txt1 = '$Area=pnorm(%f)$' % c txt1 += '$=%f$' % p myplot += text(txt1, (1.3,0.5), fontsize=15, horizontal_alignment='left') txt2 = '$Cuantil=qnorm(%f)$' % p txt2 += '$=%f$' % c myplot += text(txt2, (1,0.4), fontsize=15, horizontal_alignment='left') #myplot += text('$Area=pnorm(%f)$' % c, (2,0.4), fontsize=15, horizontal_alignment='left') #myplot += text('$=%f$' % r.pnorm(c)._sage_(), (2.7,0.25), fontsize=15, horizontal_alignment='left') myplot.show() 
       

Click to the left again to hide and once more to show the dynamic interactive window

Para calcular cuantiles de la distribución normal estándar usamos r.qnorm. A continuación calculamos los tres cuartiles de la distribución N(0,1) usando listas como aprendimos en la práctica anterior.

cuartos = [0.25, 0.51, 0.75] [r.qnorm(p)._sage_() for p in cuartos] 
       
[-0.674489750196082, 0.0250689082587111, 0.674489750196082]
[-0.674489750196082, 0.0250689082587111, 0.674489750196082]

Ejercicio 1. Demuestra numéricamente la regla 68 - 95 - 99,7 en el caso de la distribución normal estándar.

 
       
 
       

Ejercicio 2. Sea una variable $X$ que sigue una distribución normal estándar.

  • Calcula la probabilidad de que $X$ sea mayor que 1.5.
  • Calcula la probabilidad de que $X$ esté entre -1.2 y 0.9.
  • Calcula el intervalo de confianza del 85% para $X$.
  • Calcula otro intervalo que contenga el valor de $X$ con probabilidad del 85%.
 
       
 
       
 
       
 
       

Para trabajar con distribuciones normales de parámetros arbitrarios, $N(\mu,\sigma)$, hay dos maneras:

  • Tipificando (es decir relacionando con la normal estándar).
  • Usando las funciones vistas arriba, pero con la media y la desviación típica como argumentos.

Ejemplo: si el valor real de una distancia es 1643.443 m y medimos con una precisión de un milímetro, la probabilidad de observar un valor menor a 1643.442 m es:

r.pnorm(1643.442,mean=1643.443,sd=0.001)._sage_() 
       
0.158655253937179
0.158655253937179

Y ahora calculemos el intervalo de confianza al 95%:

a = r.qnorm(0.025,mean=1643.443,sd=0.001)._sage_() b = r.qnorm(0.975,mean=1643.443,sd=0.001)._sage_() a,b 
       
(1643.44104003602, 1643.44495996398)
(1643.44104003602, 1643.44495996398)

Ejercicio 3. Supongamos que la estatura en centímetros del alumnado del CUM sigue una distribución $N(170,5)$.

  • Calcula la probabilidad de que un/a estudiante mida entre 163 y 169 cm.
  • Calcula la probabilidad de que un/a estudiante mida exactamente 172 cm.
  • Para hacer un equipo de baloncesto mixto queremos hacer pruebas al 2% más alto del alumnado. ¿Cuál sería la estatura mínima?
  • Para saber cuánta gente hay en ese 2%, nos pasan un dato obtenido en otro estudio: 241 estudiantes miden menos de 168 cm. ¿A cuánta gente habrá que hacer las pruebas de baloncesto?

 
       
 
       
 
       
 
       

Ejercicio 4. Para medir el perímetro de una finca rectangular medimos dos lados no opuestos de manera independiente y calculamos el resultado a partir de esas dos mediciones. Las medidas de cada tramo (en m) siguen una distribución normal: $N(214.31, 0.88)$ y $N(161.77, 0.34)$ respectivamente. Calcula intervalos de confianza al 99% para cada lado y para el perímetro.

 
       
 
       
 
       

Ejercicio 5 (opcional). Una empresa vende paquetes de 1 Kg de azúcar. Dado que el paquete dice "1 Kg" en la etiqueta, un paquete que tenga menos de 1 Kg de azúcar no es aceptable para el cliente (si hay más de 1 Kg no se quejará, obviamente). Sabemos que el proceso de empaquetado produce paquetes cuyos pesos (en gramos) siguen una distribución $N(1010, 4)$.

  • ¿Qué porcentaje de paquetes no son aceptables?
  • Queremos que de cada 10000 paquetes haya como mucho 4 no aceptables. Para eso vamos a usar el mismo proceso de fabricación rellenando un poco más; esto significa que aumentaremos la media pero mantendremos $\sigma=4$. ¿Qué podemos decir de esa nueva media?
  • Con el mismo objetivo de antes, queremos mejorar la precisión del proceso (reducir la desviación típica) sin cambiar $\mu=1010$. ¿Qué valores nos valen?
 
       
 
       
 
       
 
       

Ejercicio 6 (opcional). Piensa en una medición que hayas hecho recientemente y haz una lista detallada de todas las pequeñas fuentes de error que se te ocurra que ha habido en el proceso.