Un histograma es el gráfico estadístico que se utiliza para representar unos datos continuos cuando vienen agrupados en intervalos. Sobre cada uno de estos intervalos se levanta una franja tan ancha como el intervalo y de forma que su área sea proporcional a su frecuencia. Normalmente se construye de forma que el área de cada franja sea igual a la correspondiente frecuencia relativa. Así el área total limitada por el histograma es igual a 1, y el área de cada intervalo, el tanto por uno que representa sobre el total .
A lo largo de la historia, matemáticos como De Moivre, Gauss o Galton se sorprendieron por la frecuencia con la que aparece la llamada curva Normal o de Gauss que, en multitud de ocasiones, podemos encontrar como respuesta continua a estudios estadísticos tan aparentemente distintos como la distribución de alturas de un grupo de personas, la resistencia de un tipo determinado material eléctrico, el porcentaje de veces que se presenta una avería determinada en un ordenador, entre otros.
Existen varios tipos de histograma en función de la utilidad que presenta:
Diagramas de barras simples: Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.
Diagramas de barras compuesta: Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.
Diagramas de barras agrupadas: Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.
Polígono de frecuencias: Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.
Ojiva porcentual: Es un gráfico acumulativos, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
¿Cómo se construye un histograma?
Determinar el rango de los datos que definen las muestras, es decir, la diferencia entre el dato mayor y el dato menor.
Obtener los números de intervalos, existen varios criterios para determinar el número de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de muestras) es mayor que cinco, por lo que se seleccionan seis clases.
Establecer la longitud del intervalo: es igual al rango entre el número de clases. Normalmente, en una distribución lineal deberemos hacer los intervalos de igual tamaño, por lo que tomaremos franjas de amplitud nº muestras/rango.
Construir los intervalos: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos iguales. Por ejemplo, si de 48 muestras, el valor menor es 3 y el rango 8, serán 6 intervalos (48/12): de 3 a 11, de 11 a 19, de 19 a 27,… solo tenemos que decidir un criterio de qué hacemos con los extremos (si se consideran en un intervalo o en el siguiente)
Realizar la tabla de frecuencias: Contar el número de muestras que aparecen en cada intervalo, obteniendo así las frecuencias de cada intervalo en una tabla independiente. Suele ser bastante útil ordenar los datos en orden creciente para contarlos, aunque existen funciones matemáticas que lo hacen aunque no todo lo bien que se deseas (Contar.si(Rango;Criterio))
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias, mientras que si se obtiene una línea de tendencia, se representan podrá ver el tipo de distribución del histograma (y su expresión polinómica)
Análisis de los resultados: No nos olvidemos para qué sirve un gráfico, así que para terminar, se deben extraer las conclusiones oportunas con ayuda de valores estadísticos y porcentuales de los datos muestreados.
0 comentarios:
Publicar un comentario