Gráfico de barras vs histograma
En estadística, es importante resumir y presentar los datos. Se puede hacer numéricamente usando medidas descriptivas o gráficamente usando gráficos circulares, gráficos de barras y muchos otros métodos de representación gráfica.
¿Qué es un gráfico de barras?
El gráfico de barras es uno de los principales métodos de representación gráfica en estadística. Se utiliza para mostrar valores distintos de los datos cualitativos en un eje horizontal y las frecuencias relativas (o frecuencias o porcentajes) de esos valores en un eje vertical. Una barra con su altura / longitud proporcional a la frecuencia relativa representa cada valor distinto, y las barras están colocadas de manera que no se toquen entre sí. Un gráfico de barras con la configuración anterior es el más común y se conoce como gráfico de barras verticales o gráfico de columnas. Pero también es posible intercambiar los ejes; en ese caso las barras son horizontales.
El gráfico de barras se utilizó por primera vez en el libro de 1786 "El Atlas comercial y político" de William Playfair. Desde entonces, el gráfico de barras se ha convertido en una de las herramientas más importantes para representar datos categóricos. El uso de gráficos de barras se puede ampliar para representar datos categóricos más complejos, como variables de desarrollo del tiempo (respuesta electoral), datos agrupados y más.
¿Qué es un histograma?
El histograma es otra representación gráfica importante de datos, y puede considerarse como un desarrollo del gráfico de barras. En un histograma, las clases de datos cuantitativos se muestran en el eje horizontal y la frecuencia (o frecuencia relativa o porcentajes) de las clases se muestran en el eje y. Una barra vertical generalmente representa la frecuencia (o frecuencia relativa o porcentajes) de la clase cuya altura es igual a su magnitud. A diferencia de los gráficos de barras normales, las barras están colocadas para tocarse entre sí.
La variable en el eje X puede ser agrupada por valor único o agrupada por límites. Para la agrupación de un solo valor, se utilizan valores distintos de las observaciones para etiquetar las barras, con cada uno de esos valores centrados debajo de su barra. Para la agrupación de límites o la agrupación de puntos de corte, se utilizan límites de clase inferiores (o, de manera equivalente, puntos de corte de clase inferior) para etiquetar las barras. También se pueden utilizar marcas de clase o puntos medios de clase centrados debajo de las barras.
Una de las principales diferencias radica en la variable utilizada en el eje X. En el histograma, la variable es una variable cuantitativa y puede ser continua o discreta. Y se puede utilizar para representar información de densidad sobre los conjuntos de datos. En este caso, los intervalos usados en el eje x pueden variar de uno a otro, y en el eje y, se marca la densidad de frecuencia. Si el intervalo del eje X es 1, entonces el histograma es igual al gráfico de frecuencia relativa.
¿Cuál es la diferencia entre el gráfico de barras y el histograma?
• En primer lugar, un histograma es un desarrollo del gráfico de barras, pero no es idéntico a un gráfico de barras. Los histogramas son un tipo de gráficos de barras, pero los gráficos de barras definitivamente no son histogramas.
• Los gráficos de barras se utilizan para trazar datos categóricos o cualitativos, mientras que los histogramas se utilizan para trazar datos cuantitativos con los rangos de los datos agrupados en bins o intervalos.
• Los gráficos de barras se utilizan para comparar variables, mientras que los histogramas se utilizan para mostrar distribuciones de variables.
• Los gráficos de barras tienen espacios entre dos barras, mientras que los histogramas no tienen espacios entre las barras. (La razón es que el eje x en los gráficos de barras son valores categóricos discretos mientras que, en los histogramas, es cuantitativo discreto o continuo).
• Los histogramas se utilizan para ilustrar la densidad de una variable en intervalos; en este caso, el área de la barra representa la frecuencia de la variable.