Calculadora del gráfico de barras de la media, la mediana y la moda
Contenidos
Un histograma es un gráfico que traza la distribución de los valores de una variable numérica como una serie de barras. Cada barra normalmente cubre un rango de valores numéricos llamado bin o clase; la altura de una barra indica la frecuencia de los puntos de datos con un valor dentro del bin correspondiente.
El histograma anterior muestra una distribución de frecuencias para el tiempo de respuesta de los tickets enviados a un sistema de soporte ficticio. Cada barra cubre una hora de tiempo, y la altura indica el número de tickets en cada rango de tiempo. Podemos ver que la mayor frecuencia de respuestas se encuentra en el rango de 2-3 horas, con una cola más larga a la derecha que a la izquierda. También hay una colina más pequeña cuyo pico (modo) está en el rango de 13-14 horas. Si sólo nos fijáramos en las estadísticas numéricas, como la media y la desviación estándar, podríamos pasar por alto el hecho de que existen estos dos picos que contribuyen a las estadísticas generales.
Los histogramas son buenos para mostrar las características generales de distribución de las variables del conjunto de datos. Se puede ver aproximadamente dónde están los picos de la distribución, si la distribución es sesgada o simétrica, y si hay algún valor atípico.
Cómo encontrar la mediana en un gráfico de barras
Los datos representan los resultados de una encuesta sobre cómo se desplazan al trabajo las personas que viven en dos ciudades diferentes. Las filas corresponden a los encuestados y las columnas al modo de transporte, así como a la ciudad en la que viven.
En este caso, la ciudad y el modo de desplazamiento son variables cualitativas, también denominadas variables nominales o categóricas. Los valores que puede tomar una variable cualitativa (Bicicleta, Autobús, Coche… en el caso del modo de transporte) se denominan categorías, o niveles. Nuestro objetivo aquí es describir las preferencias de transporte a la hora de ir al trabajo por ciudad utilizando:
3. En la pestaña General, seleccione la columna correspondiente al modo de transporte en el campo Datos cualitativos. Como el objetivo es describir la preferencia de transporte por ciudad, seleccionamos la columna correspondiente a la ciudad en el campo Submuestras.
También queremos mostrar las etiquetas de la categoría de la variable en la salida. Estas incluyen el nombre de la variable como prefijo y el nombre de la categoría como sufijo. Por último, seleccionamos la opción Hoja para mostrar los resultados en una nueva hoja y las Etiquetas de la muestra para considerar la primera fila de la tabla de datos como etiquetas.
Cómo encontrar el rango de un gráfico de barras
La moda es uno de los valores de las medidas de tendencia central. Este valor nos da una idea aproximada de cuáles son los elementos de un conjunto de datos que tienden a aparecer con más frecuencia. Por ejemplo, se sabe que una universidad ofrece 10 cursos diferentes a los estudiantes. Ahora bien, de estos, el curso que tiene el mayor número de inscripciones de los estudiantes se contará como la moda de nuestros datos dados (número de estudiantes que toman cada curso). Así que, en general, la moda nos habla de la mayor frecuencia de un elemento determinado en el conjunto de datos.
Hay muchos usos en la vida real y la importancia de utilizar el valor de la moda. Hay muchos aspectos en los que la simple búsqueda de la media no funciona. Por ejemplo, consulte el ejemplo anterior. Para encontrar el mayor número de estudiantes matriculados en un curso, encontrar cualquiera de la media o la mediana no funcionará. Por lo tanto, tendemos a utilizar el modo en estos casos.
La moda es el valor o número que aparece con mayor frecuencia en un conjunto de datos. A veces es necesario encontrar el valor que aparece con más frecuencia en el conjunto de datos. En estos casos, encontramos el modo para el conjunto de datos dado. Puede haber o no un valor modal para un conjunto de datos dado. En el caso de los datos que no tienen valores repetidos, puede que no haya ninguna moda. Además, podemos encontrar datos con un solo modo, dos modos, tres modos o múltiples modos. Esto depende del conjunto de datos dado.
Hojas de trabajo del gráfico de barras de la media, la mediana y la moda
Para caracterizar o describir un conjunto de datos, debemos aprender el significado y la finalidad de varios tipos diferentes de valores estadísticos. Dos estadísticas importantes son las medidas de tendencia central y de dispersión. Como su nombre indica, una medida de tendencia central intenta describir el “centro” de un conjunto de datos -este centro puede ser el valor más común, el valor que se encuentra en el medio del rango de valores en el conjunto de datos, o algún promedio de los valores en el conjunto de datos. (Probablemente haya oído hablar de los promedios y los haya utilizado antes; aquí profundizaremos en los promedios y en medidas similares con más detalle). Esta lección está dedicada a las medidas de tendencia central; más adelante, también consideraremos la dispersión, que es una medida de la “dispersión” de los datos alrededor de algún centro, y la asimetría (asimetría), que mide cómo los datos están “sesgados” hacia cualquier lado del centro.
Un conjunto de datos como el que se muestra en el siguiente histograma muestra un centro bastante obvio: la barra central. Si está familiarizado con los promedios (medias), probablemente ya pueda señalar la media de los datos, que es la barra central (y más alta) del gráfico (suponiendo que los valores de los datos a los que corresponden las barras estén distribuidos uniformemente, como sería el caso en un histograma)