Desviación estándar vs media
En estadística descriptiva e inferencial, se utilizan varios índices para describir un conjunto de datos correspondiente a su tendencia central, dispersión y sesgo. En inferencia estadística, estos se conocen comúnmente como estimadores, ya que estiman los valores de los parámetros de población.
La tendencia central se refiere y ubica el centro de la distribución de valores. La media, la moda y la mediana son los índices más utilizados para describir la tendencia central de un conjunto de datos. La dispersión es la cantidad de difusión de datos desde el centro de la distribución. El rango y la desviación estándar son las medidas de dispersión más comúnmente utilizadas. Los coeficientes de asimetría de Pearson se utilizan para describir la asimetría de una distribución de datos. Aquí, la asimetría se refiere a si el conjunto de datos es simétrico con respecto al centro o no y, de no ser así, cuán sesgado está.
¿Que significa?
La media es el índice de tendencia central más utilizado. Dado un conjunto de datos, la media se calcula tomando la suma de todos los valores de los datos y luego dividiéndolos por el número de datos. Por ejemplo, el peso de 10 personas (en kilogramos) se mide en 70, 62, 65, 72, 80, 70, 63, 72, 77 y 79. Entonces, el peso medio de las diez personas (en kilogramos) puede ser calculado de la siguiente manera. La suma de los pesos es 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Media = (suma) / (número de datos) = 710/10 = 71 (en kilogramos).
Como en este ejemplo particular, el valor medio de un conjunto de datos puede no ser un punto de datos del conjunto, pero será único para un conjunto de datos dado. La media tendrá las mismas unidades que los datos originales. Por lo tanto, se puede marcar en el mismo eje que los datos y se puede utilizar en comparaciones. Además, no hay ninguna restricción de signo para la media de un conjunto de datos. Puede ser negativo, cero o positivo, ya que la suma del conjunto de datos puede ser negativo, cero o positivo.
¿Qué es la desviación estándar?
La desviación estándar es el índice de dispersión más utilizado. Para calcular la desviación estándar, primero se calculan las desviaciones de los valores de los datos de la media. La media de la raíz cuadrada de las desviaciones se llama desviación estándar.
En el ejemplo anterior, las desviaciones respectivas de la media son (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 y (79-71) = 8. La suma de los cuadrados de desviación son (-1) 2+ (-9) 2 + (-6) 2 + 1 2 +9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366 La desviación estándar es √ (366/10) = 6.05 (en kilogramos). A partir de esto, se puede concluir que la mayoría de los datos están en el intervalo 71 ± 6.05, siempre que el conjunto de datos no esté muy sesgado, y de hecho lo es en este ejemplo en particular.
Dado que la desviación estándar tiene las mismas unidades que los datos originales, nos da una medida de cuánto se desvían los datos del centro; mayor la desviación estándar mayor la dispersión. Además, la desviación estándar será un valor no negativo independientemente de la naturaleza de los datos en el conjunto de datos.
¿Cuál es la diferencia entre la desviación estándar y la media? • La desviación estándar es una medida de dispersión desde el centro, mientras que la media mide la ubicación del centro de un conjunto de datos. • La desviación estándar es siempre un valor no negativo, pero la media puede tomar cualquier valor real. |