Lección 1
Distribución de frecuencia
Una muy buena manera de organizar datos, es mediante una tabla de frecuencia, que además de presentarlos en forma organizada, sirve también para analizar y comprender su distribución, con el fin de descubrir propiedades de interés en el estudio del fenómeno.
Para datos cuantitativos
Lo primero que debemos determinar para nuestra tabla de frecuencia cuando se tienen datos cualitativos, es el número de intervalos, los cuales perfectamente pueden ser determinados en forma empírica entre 5 y 15, proporcional al número de datos.
Cuando no se tiene seguridad en el tema, una buena solución es utilizar la fórmula de Sturges:
k = 1 + 3.322 log(n) (1)
donde n es el número de datos y k el número de intervalos.
Luego encontramos en ancho del intervalo con la fórmula
I = DM − Dm k (2)
Donde DM es el dato mayor, Dm el dato menor e I el ancho del intervalo.
Con estos resultados, realizaremos una tabla donde sus columnas serán:
- Intervalos: Donde estarán los límites inferiores y superiores de cada intervalo.
- Marca de clase (mi): Que es el punto medio de cada intervalo.
- Frecuencia absoluta (fi): Que es el número de veces que aparece un determinado valor en el intervalo.
- Frecuencia acumulada (Fi): Que es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Ejemplo
Los siguientes datos corresponden al peso en kilogramos de 50 personas. Expresar estos datos en una tabla de frecuencia.
71 | 58 | 55 | 80 | 73 | 75 | 67 | 60 | 69 | 59 |
77 | 54 | 51 | 60 | 68 | 72 | 78 | 82 | 57 | 61 |
58 | 67 | 72 | 68 | 74 | 65 | 72 | 79 | 80 | 60 |
60 | 78 | 78 | 73 | 74 | 75 | 80 | 76 | 70 | 67 |
84 | 76 | 65 | 67 | 73 | 74 | 58 | 60 | 66 | 70 |
Solución
Con la fórmula (1), podemos hallar el número de intervalos, sabiendo que n = 50.
k = 1 + 3.322 log(50) = 6.64 ≈ 7
Tomaremos k = 7, pues siempre debemos aproximar al primer entero mayor.
Ahora, de la lista de datos identificamos que Dm = 51 y DM = 84. Y con la fórmula (2), tenemos que:
I = 84 − 51 7 = 4.7 ≈ 5