sábado, 22 de abril de 2017

Tema 8: Medidas de tendencia central, posición y dispersión.

1. Resumen numérico de una Serie Estadística.

Podemos sintetizar una serie de observaciones mediante estadísticos (función de los  datos observados. Hay que tener en cuenta que se imparte sobre cuantitativas continuas.

Existen tres grandes tipos:

       · Medidas de posición: dan idea de la magnitud, tamaño o posición de los datos (ordenados de mayor a menor).

       · Medidas de tendencia variabilidad: dan idea del comportamiento central de los sujetos.

       · Medidas de dispersión o variabilidad: informan sobre la heterogeneidad de los sujetos (diferencias).

2. Medidas de tendencia central.

   ·  Media aritmética (=mediana).

    Es la suma de los valores de la variable entre el total de observaciones. Es utilizada para calcular variables cuantitativas.
Cuando los se encuentra en dos intervalos: se calcula una media aritmética ponderada (suma de la marca de clase por la frecuencia absoluta/n).
·  Mediana.

Medida de posición y central (50% de los datos  menor y otro 50% de los datos mayor)

- Número de observaciones impar: la mediana seria en la posición n+1/2


- Número de observaciones par: la mediana seria la media entre la observación n/2 y la observación (n/2)+1. Ejemplo: cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética entre ambos.

      · Propiedad.
Se tiene en cuenta la posición de los valores en la muestra.

     · Moda: valor con mayor frecuencia. Muestra Bimodal = dos modas, muestra Multimodal = más de dos modas. Hay que tener en cuenta que la moda no es el número más frecuente si no  la categoría.

3. Medidas de posición o cuantiles.

Se calcula para variables cuantitativas y solo se tiene en cuenta la posición de los valores, ordenados de mayor a menor.
Los cuantiles se dividen en: - Perciles: muestras ordenadas en 100.
                                             - Deciles: muestras ordenadas en 10.
                                       - Cuartiles: muestras ordenadas en 4.

  • Percentiles (Pi): valor que ordena las observaciones  en forma creciente. Para buscar la posición de un percentil, buscamos el intervalo en la que la frecuencia relativa acumulada sea superior al valor del percentil. P50  = mediana. 

  • Deciles (Di): valor que ordena las observaciones en forma creciente. D5 = Mediana = P50
             · Cuartil: 
                           - El Q1, indica el valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.

  - El Q2, indica el valor que ocupa una posición en la serie numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Q2 = D5 = P50.

  - El Q3, indica el valor que ocupa una posición en la serie numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores.

  - El Q4, indica el valor mayor que se alcanza en la serie numérica.

4. Medidas de dispersión.

La información que nos aporta es limitada.

  • Rango o recorrido: diferencia entre el mayor y e menor valor de la muestra     lXn-X1l.


  • Desviación media: media aritmética de las distancias de cada observación con respecto  a la media de la muestra.

  • Desviación típica o estándar: calcular el error que cometemos si representamos una muestra únicamente por su media.
  • Varianza: expresa la misma información en valores cuadráticos
  • Recorrido intercuartílico: diferencia entre el tercer y primer cuartil = lQ3-Q1l.
  • Coeficiente de variación: medida de dispersión relativa (adimensional). Se utiliza para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas. C.V = S/ X (sin unidades).

5. Distribuciones normales.

Se llama distribución normal, distribución de Gauss o distribución gaussina, a la distribución de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica de los valores de posición central. Es simétrica dejando la mitad de los valores por debajo del punto máximo y la mitad de los valores por encima. 

6. Asimetrías y Curtosis. 



La asimétrica hacia la izquierda se sabe porque la media está a la izquierda. La asimétrica hacia la derecha es porque la media está a la derecha.

Hay que tener en cuenta que la asimetría lo marca la media y que el pico de la gráfica es la moda.

  • Coeficiente de asimetría de una variable: grado de asimetría de la distribución de sus datos en torno a su media.
                               - g1 = 0: distribución simétrica.

                               - g1 > 0: distribución asimétrica positiva.

                               - g1 < 0: distribución asimétrica negativa.

  • Curtosis: también recibe el nombre de apuntamiento de la curva, sirve para medir el grado de concentración de los valores que toma en torno a su media.
Como referencia se elige una variable  con distribución normal.



Los resultados pueden ser:
- g2 = 0: distribución mesocúrtica (en la imagen es la B).

- g2 > 0: distribución leptocúrtica (en la imagen es la A).

- g2 < 0: distribución platicúrtica (en la imagen es la C).

7. Tipicación de los valores y su relación con la campana de Gauss.

La tipificación nos permite conocer si el valor corresponde o no a esa distribución con frecuencia.


Por la forma de la curva se sabe:

La media coincide con lo más alto de la campana: 8

La desviación típica es de 2 puntos:

-          El 50 % tienen puntuaciones >8

-          El 50% tiene puntuaciones <8

-          Aproximadamente el 68% puntúa entre 6 y 10

            Media +/- 1 desviación típica: 68%

·         8+/-1: 6-10
Media +/- 2 desviaciones típicas: 95%

·         4-12
Media +/- 3 desviación típica: 99%

·         2-12





No hay comentarios:

Publicar un comentario