Tabla de contenidos
Medidas de dispersión son parámetros estadísticos que se utilizan para determinar el grado de variabilidad de los datos en un conjunto de valores.
El uso de estos parámetros hace que el análisis de una muestra sea más confiable, ya que las variables de tendencia central (media, mediana, moda) muchas veces ocultan la homogeneidad o no de los datos.
Por ejemplo, consideremos a un animador de fiestas infantiles para seleccionar actividades de acuerdo con la edad promedio de los niños invitados a una fiesta.
Consideremos las edades de dos grupos de niños que participarán en dos fiestas diferentes:
- Parte A: 1 año, 2 años, 2 años, 12 años, 12 años y 13 años
- Partido B: 5 años, 6 años, 7 años, 7 años, 8 años y 9 años
En ambos casos, la media es de 7 años. Sin embargo, al observar las edades de los participantes, ¿podemos admitir que las actividades elegidas son las mismas?
Por tanto, en este ejemplo, el promedio no es una medida eficiente, ya que no indica el grado de dispersión de los datos.
Las medidas de dispersión más utilizadas son: amplitud, varianza, desviación estándar y coeficiente de variación.
Amplitud
Esta medida de dispersión se define como la diferencia entre la observación más grande y la más pequeña de un conjunto de datos, es decir:
A = Xmás grande – Xmenor
Como es una medida que no tiene en cuenta cómo se distribuyen efectivamente los datos, no se utiliza mucho.
Ejemplo
El departamento de control de calidad de una empresa selecciona piezas de un lote al azar. Cuando el ancho de las medidas de los diámetros de las piezas supere los 0,8 cm, se rechaza el lote.
Considerando que en un lote se encontraron los siguientes valores: 2,1 cm; 2,0 cm; 2,2 cm; 2,9 cm; 2,4 cm, ¿este lote fue aprobado o rechazado?
Solución
Para calcular la amplitud, basta con identificar los valores más bajo y más alto, que en este caso son 2,0 cm y 2,9 cm. Calculando la amplitud, tenemos:
H = 2,9 – 2 = 0,9 cm
En esta situación, el lote fue rechazado porque la amplitud excedió el valor límite.
Diferencia
La varianza está determinada por la media de los cuadrados de las diferencias entre cada una de las observaciones y la media aritmética de la muestra. El cálculo se basa en la siguiente fórmula:
Ser,
V: varianza
XI: valor observado
MA: media aritmética de la muestra
n: número de datos observados
Ejemplo
Teniendo en cuenta las edades de los hijos de las dos partes indicadas anteriormente, calcularemos la varianza de estos conjuntos de datos.
Fiesta A
Datos: 1 año, 2 años, 2 años, 12 años, 12 años y 13 años
Promedio:
Diferencia:
Partido B
Datos: 5 años, 6 años, 7 años, 7 años, 8 años y 9 años
Promedio:
Diferencia:
Tenga en cuenta que aunque el promedio es el mismo, el valor de la varianza es bastante diferente, es decir, los datos del primer conjunto son mucho más heterogéneos.
Desviacion estandar
La desviación estándar se define como la raíz cuadrada de la varianza. De esta forma, la unidad de medida de la desviación estándar será la misma que la unidad de medida de los datos, lo que no ocurre con la varianza.
Por lo tanto, la desviación estándar se encuentra haciendo:
Cuando todos los valores de una muestra son iguales, la desviación estándar es igual a 0. Cuanto más cerca de 0, menor es la dispersión de los datos.
Ejemplo
Considerando el ejemplo anterior, calcularemos la desviación estándar para ambas situaciones:
Ahora sabemos que la variación en las edades del primer grupo en relación a la media es de aproximadamente 5 años, mientras que la del segundo grupo es de solo 1 año.
Obtenga más información sobre la varianza y la desviación estándar.
Coeficiente de variación
Para encontrar el coeficiente de variación, debemos multiplicar la desviación estándar por 100 y dividir el resultado por la media. Esta medida se expresa como porcentaje.
El coeficiente de variación se utiliza cuando necesitamos comparar variables que tienen diferentes promedios.
Como la desviación estándar representa cuánto se dispersan los datos en relación a un promedio, al comparar muestras con diferentes promedios, su uso puede generar errores de interpretación.
Así, al comparar dos conjuntos de datos, el más homogéneo será el que tenga el coeficiente de variación más bajo.
Ejemplo
Un profesor aplicó una prueba a dos clases y calculó el promedio y la desviación estándar de las calificaciones obtenidas. Los valores encontrados se encuentran en la siguiente tabla.
Desviacion estandar | Promedio | |
---|---|---|
Clase 1 | 2.6 | 6.2 |
Clase 2 | 3,0 | 8.5 |
Con base en estos valores, determine el coeficiente de variación para cada clase e indique la clase más homogénea.
Solución
Calculando el coeficiente de variación de cada clase, tenemos:
Así, la clase más homogénea es la clase 2, a pesar de tener una mayor desviación estándar.
Ejercicios resueltos
1) En un día de verano, las temperaturas registradas en una ciudad a lo largo de un día se muestran en la siguiente tabla:
Calendario | Temperatura | Calendario | Temperatura | Calendario | Temperatura | Calendario | Temperatura |
---|---|---|---|---|---|---|---|
1 hora | 19 ºC | 7 h | 16 ºC | 1 p. M. | 24 ºC | 7 pm | 23 ºC |
2 h | 18 ºC | 8 h | 18 ºC | 2 pm | 25 ºC | 20 h | 22 ºC |
3 h | 17 ºC | 9 a. M. | 19 ºC | 15 h | 26 ºC | 21 h | 20 ºC |
4 h | 17 ºC | 10 a. M. | 21 ºC | 4 pm | 27 ºC | 22 h | 19 ºC |
5 h | 16ºC | 11 a. M. | 22 ºC | 17 h | 25 ºC | 23 h | 18 ºC |
6 h | 16 ºC | 12 h | 23 ºC | 6 pm | 24 ºC | 0 h | 17 ºC |
Con base en la tabla, indique el valor de la amplitud térmica registrada ese día.
2) El entrenador de un equipo de voleibol decidió medir la altura de los jugadores de su equipo y encontró los siguientes valores: 1,86 m; 1,97 m; 1,78 m; 2,05 m; 1,91 m; 1,80 m. Luego, calculó la varianza y el coeficiente de variación de altura. Los valores aproximados fueron respectivamente:
a) 0,08 mdos y 50%
b) 0,3 my 0,5%
c) 0,0089 mdos y 4,97%
d) 0,1 my 40%
Para obtener más información sobre este tema, consulte también: