Medidas de dispersión: toda la materia

Medidas de dispersión son parámetros estadísticos que se utilizan para determinar el grado de variabilidad de los datos en un conjunto de valores.

El uso de estos parámetros hace que el análisis de una muestra sea más confiable, ya que las variables de tendencia central (media, mediana, moda) muchas veces ocultan la homogeneidad o no de los datos.

Por ejemplo, consideremos a un animador de fiestas infantiles para seleccionar actividades de acuerdo con la edad promedio de los niños invitados a una fiesta.

Consideremos las edades de dos grupos de niños que participarán en dos fiestas diferentes:

Parte A: 1 año, 2 años, 2 años, 12 años, 12 años y 13 años
Partido B: 5 años, 6 años, 7 años, 7 años, 8 años y 9 años

En ambos casos, la media es de 7 años. Sin embargo, al observar las edades de los participantes, ¿podemos admitir que las actividades elegidas son las mismas?

Por tanto, en este ejemplo, el promedio no es una medida eficiente, ya que no indica el grado de dispersión de los datos.

Las medidas de dispersión más utilizadas son: amplitud, varianza, desviación estándar y coeficiente de variación.

Amplitud

Esta medida de dispersión se define como la diferencia entre la observación más grande y la más pequeña de un conjunto de datos, es decir:

A = X_{más grande} – X_menor

Como es una medida que no tiene en cuenta cómo se distribuyen efectivamente los datos, no se utiliza mucho.

Ejemplo

El departamento de control de calidad de una empresa selecciona piezas de un lote al azar. Cuando el ancho de las medidas de los diámetros de las piezas supere los 0,8 cm, se rechaza el lote.

Considerando que en un lote se encontraron los siguientes valores: 2,1 cm; 2,0 cm; 2,2 cm; 2,9 cm; 2,4 cm, ¿este lote fue aprobado o rechazado?

Solución

Para calcular la amplitud, basta con identificar los valores más bajo y más alto, que en este caso son 2,0 cm y 2,9 cm. Calculando la amplitud, tenemos:

H = 2,9 – 2 = 0,9 cm

En esta situación, el lote fue rechazado porque la amplitud excedió el valor límite.

Diferencia

La varianza está determinada por la media de los cuadrados de las diferencias entre cada una de las observaciones y la media aritmética de la muestra. El cálculo se basa en la siguiente fórmula:

$V es igual al estilo de inicio del numerador muestra la suma de i es igual a 1 an fin del estilo paréntesis izquierdo x con i subíndice menos MA cuadrado paréntesis derecho sobre el denominador n fin de fracción$

Ser,

V: varianza
X_I: valor observado
MA: media aritmética de la muestra
n: número de datos observados

Ejemplo

Teniendo en cuenta las edades de los hijos de las dos partes indicadas anteriormente, calcularemos la varianza de estos conjuntos de datos.

Fiesta A

Datos: 1 año, 2 años, 2 años, 12 años, 12 años y 13 años

Promedio: $MA con subíndice igual al numerador 1 más 2 más 2 más 12 más 12 más 13 sobre el denominador 6 final de la fracción igual a 42 sobre 6 igual a 7 años espaciales$

Diferencia:

$V con subíndice igual al numerador paréntesis izquierdo 1 menos 7 paréntesis derecho más paréntesis izquierdo 2 menos 7 paréntesis derecho más paréntesis izquierdo 2 menos 7 paréntesis derecho más paréntesis izquierdo 12 menos 7 paréntesis derecho más paréntesis izquierdo 12 menos 7 paréntesis derecho al cuadrado más paréntesis izquierdo 13 menos 7 paréntesis derecho al cuadrado sobre el denominador 6 final de la fracción V con un subíndice igual al numerador 36 más 25 más 25 más 25 más 25 más 36 sobre el denominador 6 final de la fracción aproximadamente igual a 28 coma 67 años de espacio al cuadrado$

Partido B

Datos: 5 años, 6 años, 7 años, 7 años, 8 años y 9 años

Promedio: $MA con b subíndice igual al numerador 5 más 6 más 7 más 7 más 8 más 9 sobre el denominador 6 final de la fracción igual a 7 años espaciales$
Diferencia:

$V con subíndice igual al numerador paréntesis izquierdo 5 menos 7 paréntesis derecho más paréntesis izquierdo 6 menos 7 paréntesis derecho más paréntesis izquierdo 7 menos 7 paréntesis derecho más paréntesis izquierdo 7 menos 7 paréntesis derecho más paréntesis izquierdo 8 menos 7 paréntesis derecho al cuadrado más paréntesis izquierdo 9 menos 7 paréntesis derecho al cuadrado sobre el denominador 6 final de la fracción V con b subíndice igual al numerador 4 más 1 más 0 más 0 más 1 más 4 sobre el denominador 6 final de la fracción aproximadamente igual a 1 coma 67 años de espacio al cuadrado$

Tenga en cuenta que aunque el promedio es el mismo, el valor de la varianza es bastante diferente, es decir, los datos del primer conjunto son mucho más heterogéneos.

Desviacion estandar

La desviación estándar se define como la raíz cuadrada de la varianza. De esta forma, la unidad de medida de la desviación estándar será la misma que la unidad de medida de los datos, lo que no ocurre con la varianza.

Por lo tanto, la desviación estándar se encuentra haciendo:

$SD igual a la raíz cuadrada de V$

Cuando todos los valores de una muestra son iguales, la desviación estándar es igual a 0. Cuanto más cerca de 0, menor es la dispersión de los datos.

Ejemplo

Considerando el ejemplo anterior, calcularemos la desviación estándar para ambas situaciones:

$DP con un subíndice igual a la raíz cuadrada de 28 punto 67 final de la raíz igual a 5 punto 35 años espaciales DP con b subíndice igual a la raíz cuadrada de 1 punto 67 final de la raíz igual a 1 punto 29 años espaciales$

Ahora sabemos que la variación en las edades del primer grupo en relación a la media es de aproximadamente 5 años, mientras que la del segundo grupo es de solo 1 año.

Obtenga más información sobre la varianza y la desviación estándar.

Coeficiente de variación

Para encontrar el coeficiente de variación, debemos multiplicar la desviación estándar por 100 y dividir el resultado por la media. Esta medida se expresa como porcentaje.

$CV igual al numerador 100. DP sobre MA al final del denominador de la fracción$

El coeficiente de variación se utiliza cuando necesitamos comparar variables que tienen diferentes promedios.

Como la desviación estándar representa cuánto se dispersan los datos en relación a un promedio, al comparar muestras con diferentes promedios, su uso puede generar errores de interpretación.

Así, al comparar dos conjuntos de datos, el más homogéneo será el que tenga el coeficiente de variación más bajo.

Ejemplo

Un profesor aplicó una prueba a dos clases y calculó el promedio y la desviación estándar de las calificaciones obtenidas. Los valores encontrados se encuentran en la siguiente tabla.

	Desviacion estandar	Promedio
Clase 1	2.6	6.2
Clase 2	3,0	8.5

Con base en estos valores, determine el coeficiente de variación para cada clase e indique la clase más homogénea.

Solución

Calculando el coeficiente de variación de cada clase, tenemos:

$CV con 1 subíndice igual al numerador 100,2 punto 6 sobre el denominador 6 punto 2 final de la fracción aproximadamente igual a 42 signo de porcentaje CV con 2 subíndice igual al numerador 100,3 sobre el denominador 8 punto 5 final de la fracción aproximadamente igual a 35 signo de porcentaje$

Así, la clase más homogénea es la clase 2, a pesar de tener una mayor desviación estándar.

Ejercicios resueltos

1) En un día de verano, las temperaturas registradas en una ciudad a lo largo de un día se muestran en la siguiente tabla:

Calendario	Temperatura	Calendario	Temperatura	Calendario	Temperatura	Calendario	Temperatura
1 hora	19 ºC	7 h	16 ºC	1 p. M.	24 ºC	7 pm	23 ºC
2 h	18 ºC	8 h	18 ºC	2 pm	25 ºC	20 h	22 ºC
3 h	17 ºC	9 a. M.	19 ºC	15 h	26 ºC	21 h	20 ºC
4 h	17 ºC	10 a. M.	21 ºC	4 pm	27 ºC	22 h	19 ºC
5 h	16ºC	11 a. M.	22 ºC	17 h	25 ºC	23 h	18 ºC
6 h	16 ºC	12 h	23 ºC	6 pm	24 ºC	0 h	17 ºC

Con base en la tabla, indique el valor de la amplitud térmica registrada ese día.

Ver respuesta

Para encontrar el valor de la amplitud térmica, debemos restar el valor de temperatura mínima del valor máximo. De la tabla, identificamos que la temperatura más baja fue de 16 ºC y la más alta de 27 ºC.

De esta forma, la amplitud será igual a:

A = 27 – 16 = 11 ºC

2) El entrenador de un equipo de voleibol decidió medir la altura de los jugadores de su equipo y encontró los siguientes valores: 1,86 m; 1,97 m; 1,78 m; 2,05 m; 1,91 m; 1,80 m. Luego, calculó la varianza y el coeficiente de variación de altura. Los valores aproximados fueron respectivamente:

a) 0,08 m^dosy 50%
b) 0,3 my 0,5%
c) 0,0089 m^dos y 4,97%
d) 0,1 my 40%

Para obtener más información sobre este tema, consulte también:

Amplitud

Ejemplo

Solución

Diferencia

Ejemplo

Fiesta A

Partido B

Desviacion estandar

Ejemplo

Coeficiente de variación

Ejemplo

Solución

Ejercicios resueltos

Papa Juan Pablo I (Albino Luciani)

Papa Benedicto XVI (Joseph Ratzinger)

Deja una respuesta Cancelar la respuesta