Media vs mediana vs moda
La media, la mediana y la moda son las principales medidas de tendencia central utilizadas en la estadística descriptiva. Son completamente diferentes entre sí y los casos en los que se utilizan para resumir los datos también son diferentes.
Media
La media aritmética es la suma de los valores de los datos dividida por el número de valores de los datos, es decir
Si los datos provienen de un espacio muestral, se denomina media muestral (
), que es una estadística descriptiva de la muestra. Aunque es la medida descriptiva más utilizada para una muestra, no es una estadística robusta. Es muy sensible a los valores atípicos y las oscilaciones.
Por ejemplo, considere el ingreso promedio de los ciudadanos de una ciudad en particular. Dado que todos los valores de los datos se suman y luego se dividen, el ingreso de una persona extremadamente rica afecta la media de manera significativa. Por lo tanto, los valores medios no siempre son una buena representación de los datos.
Además, en el caso de una señal alterna, la corriente que pasa a través de un elemento varía periódicamente de la dirección positiva a la dirección negativa y viceversa. Si tomamos la corriente promedio que pasa por el elemento en un solo período, dará un 0, lo que significa que no ha pasado corriente por el elemento, lo que obviamente no es cierto. Por tanto, también en este caso la media aritmética no es una buena medida.
La media aritmética es un buen indicador cuando los datos se distribuyen uniformemente. Para una distribución normal, la media es igual a la moda y la mediana. También tiene los residuos más bajos cuando se considera la raíz del error cuadrático medio; por lo tanto, la mejor medida descriptiva cuando se requiere representar un conjunto de datos con un solo número.
Mediana
Los valores del punto de datos intermedio después de organizar todos los valores de datos en orden ascendente se definen como la mediana del conjunto de datos. La mediana es el segundo cuartil, el quinto decil y el percentil 50.
• Si el número de observaciones (puntos de datos) es impar, entonces la mediana es la observación exactamente en el medio de la lista ordenada.
• Si el número de observaciones (puntos de datos) es par, entonces la mediana es la media de las dos observaciones del medio en la lista ordenada.
La mediana divide la observación en dos grupos; es decir, un grupo (50%) de valores superiores y un grupo (50%) de valores inferiores a la mediana. Las medianas se utilizan específicamente en distribuciones sesgadas y representan los datos bastante mejor que la media aritmética.
Modo
La moda es el número que más ocurre en un conjunto de observaciones. La moda de un conjunto de datos se calcula encontrando la frecuencia de cada elemento dentro del conjunto.
• Si ningún valor aparece más de una vez, entonces el conjunto de datos no tiene modo.
• De lo contrario, cualquier valor que ocurra con la mayor frecuencia es una moda del conjunto de datos.
Puede existir más de 1 modo en un conjunto; por lo tanto, la moda no es una estadística única de un conjunto de datos. En una distribución uniforme, hay un modo. La moda de una distribución de probabilidad discreta es el punto donde la función de masa de probabilidad alcanza su punto más alto. A partir de las interpretaciones anteriores, podemos decir que los máximos globales son modos.
Considere la aplicación de las tres medidas al siguiente conjunto de datos.
DATOS: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Media = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8.12
Mediana = 9 (elemento 13)
Modo = 9 (frecuencia de 9 = 5)
¿Cuál es la diferencia entre Media, Mediana y Moda?
• La media aritmética es la suma de los valores (observaciones) dividida por el número de observaciones. No es una estadística robusta y depende en gran medida de la naturaleza de la distribución normal dentro de la distribución considerada. Un solo valor atípico puede causar un cambio significativo en la media dando valores relativamente engañosos. El concepto se puede extender a media geométrica, media armónica, media ponderada, etc.
• La mediana son los valores medios del conjunto de observaciones y se ve relativamente menos afectada por los valores atípicos. Puede dar una buena estimación como estadística de resumen en casos muy sesgados.
• La moda son los valores de observación más comunes en el conjunto de datos. Si la distribución tiene un sesgo positivo, la moda se sitúa a la izquierda de la mediana y, si tiene un sesgo negativo, la moda se sitúa a la derecha de la mediana.
• Si tiene un sesgo positivo, la media está a la derecha de la mediana; si la media con sesgo negativo está a la izquierda de la mediana.
• En la distribución normal, los tres, la media, la moda y la mediana son iguales.