1. Resumen numérico de
una Serie Estadística.
Podemos sintetizar una serie de observaciones mediante
estadísticos (función de los datos
observados. Hay que tener en cuenta que se imparte sobre cuantitativas
continuas.
Existen tres grandes tipos:
· Medidas
de posición: dan idea de la magnitud, tamaño o posición de los datos (ordenados
de mayor a menor).
· Medidas
de tendencia variabilidad: dan idea del comportamiento central de los sujetos.
· Medidas
de dispersión o variabilidad: informan sobre la heterogeneidad de los sujetos
(diferencias).
2. Medidas de tendencia
central.
· Media
aritmética (=mediana).
Es la suma de los valores de la variable entre el total de
observaciones. Es utilizada para calcular variables cuantitativas.
Cuando los se encuentra en dos intervalos: se calcula una
media aritmética ponderada (suma de la marca de clase por la frecuencia
absoluta/n).
· Mediana.
Medida de posición y central
(50% de los datos menor y otro 50% de
los datos mayor)
- Número de observaciones impar:
la mediana seria en la posición n+1/2
- Número de observaciones par:
la mediana seria la media entre la observación n/2 y la observación (n/2)+1. Ejemplo: cuatro sujetos de edades,
10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética
entre ambos.
· Propiedad.
Se tiene en cuenta la posición
de los valores en la muestra.
· Moda: valor con mayor frecuencia. Muestra Bimodal
= dos modas, muestra Multimodal = más de dos modas. Hay que tener en cuenta que
la moda no es el número más frecuente si no
la categoría.
3. Medidas de posición o cuantiles.
Se calcula para variables
cuantitativas y solo se tiene en cuenta la posición de los valores, ordenados
de mayor a menor.
Los cuantiles se dividen en: -
Perciles: muestras ordenadas en 100.
- Deciles: muestras ordenadas en
10.
- Cuartiles: muestras
ordenadas en 4.
- Percentiles (Pi): valor que ordena las observaciones en forma creciente. Para buscar la posición de un percentil, buscamos el intervalo en la que la frecuencia relativa acumulada sea superior al valor del percentil. P50 = mediana.
- Deciles
(Di): valor que ordena las observaciones en forma creciente. D5 =
Mediana = P50
· Cuartil:
- El Q1, indica el valor que ocupa una posición en
la serie numérica de forma que el 25% de las observaciones son menores y que el
75% son mayores.
- El Q2, indica el valor que ocupa
una posición en la serie numérica de forma que el 50% de las observaciones son
menores y que el 50% son mayores. Q2 = D5 = P50.
-
El Q3, indica el valor que ocupa una posición en la serie numérica
de forma
que el 75% de las observaciones son menores y que el 25% son mayores.
-
El Q4, indica el valor mayor que se alcanza en la serie numérica.
4. Medidas de dispersión.
La información que nos aporta es
limitada.
- Rango o recorrido:
diferencia entre el mayor y e menor valor de la muestra lXn-X1l.
- Desviación media:
media aritmética de las distancias de cada observación con respecto a la media de la muestra.
- Desviación típica o estándar: calcular el error que cometemos si representamos una muestra únicamente por su media.
- Varianza: expresa la misma información en valores cuadráticos
- Recorrido intercuartílico: diferencia entre el tercer y primer cuartil = lQ3-Q1l.
- Coeficiente de variación:
medida de dispersión relativa (adimensional). Se utiliza para comparar la
heterogeneidad de dos series numéricas con independencia de las unidades
de medidas. C.V = S/ X (sin unidades).
5. Distribuciones normales.
Se llama distribución normal,
distribución de Gauss o distribución gaussina, a la distribución de
probabilidad de variable continua que con más frecuencia aparece en fenómenos
reales.
La gráfica de su función de
densidad tiene una forma acampanada y es simétrica de los valores de posición
central. Es simétrica dejando la mitad de los valores por debajo del punto
máximo y la mitad de los valores por encima.
6. Asimetrías y Curtosis.
La asimétrica hacia la izquierda
se sabe porque la media está a la izquierda. La asimétrica hacia la derecha es
porque la media está a la derecha.
Hay que tener en cuenta que la
asimetría lo marca la media y que el pico de la gráfica es la moda.
- Coeficiente de asimetría de una variable: grado de asimetría de la distribución de sus datos en torno a su media.
- g1 = 0: distribución simétrica.
- g1 > 0: distribución asimétrica
positiva.
- g1 < 0: distribución asimétrica
negativa.
- Curtosis:
también recibe el nombre de apuntamiento de la curva, sirve para medir el
grado de concentración de los valores que toma en torno a su media.
Como
referencia se elige una variable con
distribución normal.
Los resultados pueden ser:
- g2 = 0: distribución mesocúrtica (en la imagen es la B).
- g2 = 0: distribución mesocúrtica (en la imagen es la B).
- g2 > 0: distribución leptocúrtica (en la imagen es la A).
- g2 < 0: distribución platicúrtica (en la
imagen es la C).
7. Tipicación de los valores y su relación con la campana de
Gauss.
La tipificación
nos permite conocer si el valor corresponde o no a esa distribución con
frecuencia.
Por la forma de la curva se sabe:
La media coincide con
lo más alto de la campana: 8
La desviación típica
es de 2 puntos:
-
El
50 % tienen puntuaciones >8
-
El
50% tiene puntuaciones <8
-
Aproximadamente
el 68% puntúa entre 6 y 10
Media +/- 1
desviación típica: 68%
·
8+/-1:
6-10
Media +/- 2 desviaciones típicas: 95%
·
4-12
Media +/- 3 desviación típica: 99%
·
2-12
No hay comentarios:
Publicar un comentario