EST_1415_Practica1

1023 days ago by sevillad1415

Práctica 1 de Estadística

 

Límite de entrega de esta práctica: ver tarea en Moodle o calendario de la asignatura. Hasta una semana de retraso: vale hasta el 50%. Más de una semana de retraso: no cuenta para la nota.

Instrucciones:

  1. Haz una copia de la hoja pública y renómbrala: si tu correo es usuario@alumnos.unex.es añade al final del título _usuario, por ejemplo EST_1415_Practica2_sevillad.
    • Para cambiar el nombre pulsa en el título de la hoja (arriba del todo, entre el logo de Sage y el menú "File...")
  2. Comparte la hoja de trabajo con el usuario sevillad1415 mediante el botón Share de arriba a la derecha.
  3. Trabaja la práctica: los ejercicios marcados "opcional" son solo para subir nota.
  4. Cuando hayas terminado, haz una copia en un único fichero PDF y ponlo en el campus virtual. Esa será la versión que se evaluará. La hoja no se considera entregada si no se ha compartido (punto 2).
    • Para generar el PDF lo más sencillo es usar el botón Print de arriba e imprimir la nueva página a fichero.
    • Una alternativa es hacer capturas de pantalla (JPG, PNG...) de la hoja a imprimir, y convertirlas a PDF uniendo después los distintos ficheros generados.
  5. Ve al campus virtual, al registro de horas no presenciales, y pon allí las dedicadas a esta práctica (recuerda descontar las presenciales de laboratorio), indicando en "observaciones" la actividad.

 

 

Para la estadística descriptiva en una variable, en Sage usaremos listas de datos. Una lista no es más que un conjunto ordenado de datos (números o no), separados por comas y rodeados por corchetes.

lista = [2,3,4,5,6] lista 
       
[2, 3, 4, 5, 6]
[2, 3, 4, 5, 6]

La función "len" nos devuelve la longitud de una lista.

l = len(lista) l 
       
5
5

Podemos usar "len" para extraer el último elemento de una lista (como hemos empezado a contar por cero, hay que restar uno a la longitud). Otra manera que acepta Sage es usar el índice -1 (significa algo así como "el primero contando al revés").

En la siguiente celda mostraremos el último elemento de la lista anterior de dos maneras. Como ves, para mostrar dos resultados en una celda se ponen en la última línea separados por ";".

lista[l-1]; lista[-1] 
       
6
6
6
6

La función "sum" nos devuelve la suma de los elementos de una lista. Las funciones "max" y "min" muestran lo que dicen sus nombres.

sum(lista) 
       
20
20
max(lista) 
       
6
6
min(lista) 
       
2
2

Ejercicio 1. Calcula la media de los datos 4,6,7,8,9,10,12,14 usando la definición. Calcula el recorrido de los datos.

 
       

Sage también nos permite, de manera muy sencilla, aplicar una función a todos los elementos de una lista. La sintaxis es

[f(n) for n in L]

donde L es el nombre de la lista que nos interesa y f es la función a aplicar a cada elemento. A continuación un ejemplo donde calculamos los cuadrados de unos números.

datos = [3, 6, 7, 4, 5, 4] cuadrados = [n^2 for n in datos] cuadrados 
       
[9, 36, 49, 16, 25, 16]
[9, 36, 49, 16, 25, 16]

Ejercicio 2. Calcula la varianza, usando la definición y lo visto más arriba, de las alturas recopiladas en clase (no la calcules haciendo la suma a mano):

158, 173, 182.5, 161, 161, 173, 160, 185, 170, 176, 168, 180, 170, 170, 190, 180, 169, 162, 171, 177, 187, 182, 176, 175, 171, 150, 164, 174, 180, 188, 165, 192, 181, 155, 180, 180, 172, 175, 167

 
       

Podemos extraer un elemento de una lista indicando su posición entre corchetes. Importante: en Sage se empieza a contar desde cero, es decir, el primer elemento de una lista tiene índice cero, el segundo tiene índice uno, etc.

lista = [2,3,4,5,6] lista[0]; lista[1] 
       
2
3
2
3

Para ordenar un conjunto de datos usamos su propiedad "sort" (las propiedades de un objeto de Sage se usan con un punto después de su nombre). Ojo, al aplicar "sort" perdemos el orden original. Esto puede afectar a cálculos posteriores...

Asegúrate de entender bien el ejemplo siguiente.

datos = [13, 8, 17, 12, 16, 20, 7, 19, 17, 14] datos; datos[0] 
       
[13, 8, 17, 12, 16, 20, 7, 19, 17, 14]
13
[13, 8, 17, 12, 16, 20, 7, 19, 17, 14]
13
datos.sort() datos; datos[0] 
       
[7, 8, 12, 13, 14, 16, 17, 17, 19, 20]
7
[7, 8, 12, 13, 14, 16, 17, 17, 19, 20]
7

Ejercicio 3. Calcula los tres cuartiles de las edades recopiladas en clase:

20, 19, 20, 18, 20, 23, 24, 18, 21, 18, 19, 18, 20, 19, 19, 20, 20, 23, 19, 21, 21, 29, 21, 18, 18, 23, 40, 23, 23, 30, 25, 18, 18, 20, 18, 18, 19, 18, 18, 38

 
       

Ejercicio 4. Escribe conjuntos de cuatro datos con las siguientes propiedades:

  1. Su media es 7 y su mediana es 6.
  2. Su media es 9 y tres de los cuatro datos están por debajo de ella.
  3. Su media y su mediana coinciden, y su rango es igual a 10.
  4. Dos de los datos son 5 y 7, y su mediana es 1.
 
       

Como hemos comentado en clase, Sage contiene entre otras muchas cosas el software estadístico R. Por supuesto los cálculos más habituales en estadística se pueden hacer usando directamente funciones ya existentes en Sage/R.

A continuación tienes un ejemplo de código R en Sage. La primera línea indica a Sage que lo que viene a continuación está escrito en el lenguaje de R. Como verás la manera de definir una lista de datos y darle un nombre es distinta a la de Sage. No hace falta que te aprendas esta sintaxis, cuando necesites algo de R tendrás ejemplos de donde copiar y pegar.

Este código calcula varios indicadores estadísticos de una lista de datos numéricos y los representa de las dos maneras vistas en clase, un histograma y un diagrama de cajas.

%r A <- c(1.7,0.7,-0.1,-0.7,-3.5,14.9,3.5,17.1,-1.6,1.6,11.7,6.1,1.1,-4.0,20.9,-2.1,2.1,1.4) summary(A) hist(A) boxplot(A) .silent.me. <- dev.off() 
       
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 -4.000  -0.550   1.500   3.933   5.450  20.900 
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 -4.000  -0.550   1.500   3.933   5.450  20.900 

Ejercicio 5. Explica todos los elementos que aparecen en el diagrama de cajas usando el resumen estadístico que ha producido R al principio.

 
       

El número de intervalos del histograma ha sido elegido por Sage/R usando una cierta lógica interna que no analizaremos aquí. Puedes decirle explícitamente los intervalos que quieres añadiendo la opción "breaks" con una lista de valores reales (en sintaxis R). Ejemplo:

%r A <- c(1.7,0.7,-0.1,-0.7,-3.5,14.9,3.5,17.1,-7.6,1.6,11.7,6.1,1.1,-4.0,20.9,-9.1,2.1,1.4) hist(A,breaks=c(-10,0,40)) .silent.me. <- dev.off() 
       

Ejercicio 6. Copia el ejemplo anterior a continuación, cambiando los datos por las edades de clase de más arriba. Cambia también los intervalos para que tengan todos la misma anchura y haya tantos como dice la regla de Sturges (http://es.wikipedia.org/wiki/Regla_de_Sturges).