ASESORÍA EN LA SOLUCIÓN DE PROBLEMAS DE MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN, Y POSICIÓN PARA DATOS AGRUPADOS
¿Qué son los Datos Agrupados en Estadística Descriptiva?
Es un mecanismo por el cual tomamos un conjunto de datos de una variable que hace parte de una base de datos o datasheet, y que queremos analizar, para clasificarlos en intervalos. Estos datos de la variable de estudio, los agrupamos en clases o intervalos cerrados. Cada dato o elemento de la variable solo puede pertenecer a una sola clase o intervalo. Esto es útil cuando la variable tiene una gran cantidad de elementos (n > 50), por lo que podemos visualizar todos los elementos de la variable en una tabla de frecuencia.
Clases | Límites | Frecuencia Absoluta (f) |
1 | 110-115 | 19 |
2 | 116-121 | 22 |
3 | 122-127 | 19 |
4 | 128-133 | 24 |
5 | 134-139 | 9 |
6 | 140-145 | 21 |
7 | 146-151 | 13 |
Estos intervalos están construidos por un límite inferior y un límite superior, [Lim. Inferior, Lim. Superior]. Por ejemplo, en la anterior tabla, la Clase 1 tiene un intervalo cerrado que va desde 110 (Lim. Inferior) a 115 (Lim. Superior). Las unidades de las variables dependerá de la naturaleza de la variable y del fenómeno que estemos estudiando y analizando. Puede ser la altura (cm) de niños en una escuela, el peso (kg) de algunas personas, la distancia (m) recorrida por atletas, etc.
¿Para qué sirve una Tabla de Frecuencias?
A pesar de que una tabla de frecuencia está compuesta de elementos numéricos, no gráficos, de la variable de estudio, esta nos permite visualizar todos los datos en un solo mismo espacio por medio de una tabla de forma ordena, las clases son creciente habitualmente. Esto trae muchas ventajas al tener una cantidad considerable de datos de una variable, ya que podemos calcular la frecuencia absoluta (f) de cada clase o los elementos que pertenece a cada clase. También, podemos calcular la frecuencia relativa (n) de cada clase o su proporción individual, dentro de todos los datos de la variable.
Problema 1: Completar la Tabla de Frecuencia, para los Datos Agrupados de la Estatura en centímetros, de los estudiantes de un colegio privado de primaria.
Clases | Límites | Frecuencia Absoluta (f) |
1 | 110-115 | 19 |
2 | 116-121 | 22 |
3 | 122-127 | 19 |
4 | 128-133 | 24 |
5 | 134-139 | 9 |
6 | 140-145 | 21 |
7 | 146-151 | 13 |
Solución
Frecuencia Absoluta
Lo primero que debemos realizar, es la sumatoria de los valores de la Frecuencia Absoluta (f), la cual indica la cantidad total de elementos de la variable de estudio (número total de estudiantes). Podemos entender que cada valor de Frecuencia Absoluta es la cantidad de datos o elementos que caen dentro de cada intervalo. Por ejemplo, en la Clase 5, existen 9 estudiantes que caen dentro del intervalo de 134 a 139 cm de Estatura. Por lo tanto, al sumar todos los valores de la frecuencia absoluta de la tabla, debemos obtener el número total de datos de la muestra o población de estudio, que en nuestro problema son estudiantes.
Clases | Límites | F. Abs (f) |
1 | 110-115 | 19 |
2 | 116-121 | 22 |
3 | 122-127 | 19 |
4 | 128-133 | 24 |
5 | 134-139 | 9 |
6 | 140-145 | 21 |
7 | 146-151 | 13 |
Suma | 127 |
En nuestro caso, el número total de datos o elementos agrupados es 127 estudiantes del colegio privado de primaria.
Frecuencia Relativa
La siguiente columna agregar es la de Frecuencia Relativa (n), la cual ya hemos explicado, nos indicara el peso o la proporción de elementos que se encuentra en cada intervalo o clase. De esta manera, así poder saber qué relevancia tiene cada intervalo en el conjunto de datos de la variable que estamos estudiando.
Clases | Límites | F. Abs (f) | F. Rela (n) |
1 | 110-115 | 19 | 14,96% |
2 | 116-121 | 22 | 17,32% |
3 | 122-127 | 19 | 14,96% |
4 | 128-133 | 24 | 18,90% |
5 | 134-139 | 9 | 7,09% |
6 | 140-145 | 21 | 16,54% |
7 | 146-151 | 13 | 10,24% |
| Suma | 127 | 100,00% |
El cálculo de la Frecuencia Relativa (n) de cada Clase, es muy sencillo. Dividimos la Frecuencia Absoluta (f) de cada Clase, entre el número total de datos (# total de estudiantes), en esta caso, entre 127, y lo multiplicamos por 100. Por ejemplo, para la segunda Clase, dividimos 22/127 = 0,1732, luego lo multiplicamos por 100 para tener el resultado en porcentaje 0,1732*100 = 17,32%. Así se hace con las demás Clases. Luego, se suma cada una de las Frecuencias Relativas, y este valor debe dar exactamente 100%. Si por alguna razón este valor es superior o menor, es indicio de que tienes un error en los cálculos, por lo que tendrás que revisar.
Ahora, que significa que la Segunda Clase tenga una Frecuencia Relativa de 17,32%, esto quiere decir que el 17,32% de los estudiantes tiene una estatura entre 116 y 121 cm.
Marca de Clase
La tercera columna que vamos a agregar es la Marca de Clase (x), la cual nos indica el valor medio de cada intervalo. Por lo tanto, se calcula (Lim. Inferior + Lim. Superior)/2. A modo de ejemplo, tomamos los valores de la Clase 3, (122 + 127)/2 = 124,5 cm. La Marca de Clases se utiliza, entre otras cosas, para calcular la media para datos agrupados.
Clases | Límites | F. Abs (f) | F. Rela (n) | Marca de Clase (x) |
1 | 110-115 | 19 | 14,96% | 112,5 |
2 | 116-121 | 22 | 17,32% | 118,5 |
3 | 122-127 | 19 | 14,96% | 124,5 |
4 | 128-133 | 24 | 18,90% | 130,5 |
5 | 134-139 | 9 | 7,09% | 136,5 |
6 | 140-145 | 21 | 16,54% | 142,5 |
7 | 146-151 | 13 | 10,24% | 148,5 |
Suma | 127 | 100,00% | 913,50 |
Frecuencia Acumulada
La cuarta columna es de la Frecuencia Acumulada Absoluta (F), esta se calcula mediante la sumada de la frecuencia absoluta previa y la de la clase propia. Por ejemplo, la Frecuencia Acumulada Absoluta de la Clase 2, es 19 + 22 = 41. Esto significa que 41 estudiantes del colegio de primaria, tiene una estatura menor o igual a 121 cm. El valor de la Frecuencia Acumulada de la última clase, debe ser igual al número de datos o elementos de la variable, en nuestro caso 127 estudiantes.
Clases | Límites | F. Abs (f) | F. Rela (n) | M. Clase (x) | F. Acu (F) |
1 | 110-115 | 19 | 14,96% | 112,5 | 19 |
2 | 116-121 | 22 | 17,32% | 118,5 | 41 |
3 | 122-127 | 19 | 14,96% | 124,5 | 60 |
4 | 128-133 | 24 | 18,90% | 130,5 | 84 |
5 | 134-139 | 9 | 7,09% | 136,5 | 93 |
6 | 140-145 | 21 | 16,54% | 142,5 | 114 |
7 | 146-151 | 13 | 10,24% | 148,5 | 127 |
Suma | 127 | 100,00% | 913,50 |
Algunos de los Servicios que Ofrece Asesor Universitario
Contamos con Profesores en múltiples especialidades de estadistica, que se adaptan a tus necesidades como Estudiante Universitario o Maestria
Problema 2: Calcular las Medidas de Tendencia Central (Media, Moda, y Mediana) para los Datos Agrupados.
Solución
Casi todos los conjuntos de datos numéricos presentan Medidas de Tendencia Central, la cual consiste en que la mayoría de las cantidades numéricas de una variable, se reúnen alrededor de un valor en particular.
Para calcular todas estas medidas de tendencia central para datos agrupados, debemos agregar una nueva columna, la cual multiplicara la Marca de Clases (x) y la Frecuencia Absoluta (f).
Clases | Límites | F. Abs (f) | F. Rela (n) | M. de clase (x) | F. Acu (F) | x*f |
1 | 110-115 | 19 | 14,96% | 112,5 | 19 | 2137,5 |
2 | 116-121 | 22 | 17,32% | 118,5 | 41 | 2607 |
3 | 122-127 | 19 | 14,96% | 124,5 | 60 | 2365,5 |
4 | 128-133 | 24 | 18,90% | 130,5 | 84 | 3132 |
5 | 134-139 | 9 | 7,09% | 136,5 | 93 | 1228,5 |
6 | 140-145 | 21 | 16,54% | 142,5 | 114 | 2992,5 |
7 | 146-151 | 13 | 10,24% | 148,5 | 127 | 1930,5 |
Suma | 127 | 100,00% | 913,50 | 16393,5 |
Media para Datos Agrupados
Para calcular la Media de estos datos agrupados, utilizamos la siguiente ecuación:


La Media de estatura entre los estudiantes del colegio de primaria es de 129,08 cm.
Mediana para Datos Agrupados
Para calcular la Mediana para datos agrupados, se utiliza la siguiente ecuación:


El primer intervalo cuya Frecuencia Acumulada (F) es mayor o igual a 63,5 es la Clase 4, [128-133) con sus límites inferior y superior. Reemplazamos los valores en la ecuación de la Mediana y calculamos:


La Mediana de la estatura de los estudiantes del colegio de primaria es de 128,88 cm.
Moda para Datos Agrupados
La Moda, para un conjunto de datos agrupados, se puede calcular con la siguiente ecuación:


Lo primero que debemos ubicar es la clase o intervalo modal donde posiblemente se encuentre la Moda, para ello observamos la columna de frecuencias absolutas, buscamos la de mayor valor. En este caso sería donde está fi=24.


La Moda o intervalo modal de la estatura de los estudiantes de primaria es 129,5 cm.
Problema 3: Calcular las Medidas de Dispersión (Varianza, Desviación Estándar, Coeficiente de Variación, y Rango) para Datos Agrupados.
Solución
Las medidas de Dispersión de un conjunto de datos, nos indica como se encuentran dispersos estos, con respecto a la media aritmética. Esta variación la podemos medir con el cálculo de la varianza, la desviación estándar, el rango, el coeficiente de variación, etc.
Varianza y Desviación Estándar para Datos Agrupados
Para calcular la Varianza y la Desviación Estándar debemos utilizar la siguiente ecuación:


Para poder utilizarla, agregamos una nueva columna a nuestra tabla de frecuencia original que hallamos.
Clases | Límites | F. Abs (f) | F. Rela (n) | M. de clase (x) | F. Acu (F) | f(x- |
1 | 110-115 | 19 | 14,96% | 112,5 | 19 | 5223,03 |
2 | 116-121 | 22 | 17,32% | 118,5 | 41 | 2462,60 |
3 | 122-127 | 19 | 14,96% | 124,5 | 60 | 398,55 |
4 | 128-133 | 24 | 18,90% | 130,5 | 84 | 48,39 |
5 | 134-139 | 9 | 7,09% | 136,5 | 93 | 495,51 |
6 | 140-145 | 21 | 16,54% | 142,5 | 114 | 3782,02 |
7 | 146-151 | 13 | 10,24% | 148,5 | 127 | 4902,77 |
Suma | 127 | 100,00% | 913,50 | 17312,88 |
Reemplazo los valores en la ecuación:


La Varianza de los datos agrupados de la estatura de los estudiantes de primaria es 136,32 cm2.
La Desviación Estándar es la raíz cuadrada de la varianza:




La Desviación Estándar de los datos agrupados de las estaturas de los estudiantes de primaria es 11,67 cm.
Coeficiente de Variación
Ahora calculamos el Coeficiente de Variación. Esta medida de variación calcula el grado de dispersión de los datos de la variable. Se utiliza la siguiente ecuación:




El Coeficiente de Variación para los datos agrupados de la estatura es 9,04%.
Rango para Datos Agrupados
Por último calculamos el valor del Rango, el cual simplemente restar el límite superior más alto menos el límite menor más bajo:


El Rango para la estatura de los estudiantes es 41 cm.
Problema 4: Calcular las Medidas de Posición (Cuartiles) para Datos Agrupados.
Solución
Las medidas de posición de Cuartiles nos permite establecer divisiones en el conjunto de datos en cuatro partes iguales, para establecer como está distribuido estos. Tenemos el Cuartil 1 (Q1) que representaría el 25% de los datos, el Cuartil 2 (Q2) que representaría el 50% de los datos, y el Cuartil 3 (Q3) que representaría el 75% de los datos. Para calcular los cuartiles utilizamos la siguiente ecuación:


Cuartil 1 (Q1)
Calculamos el primer cuartil (Q1), donde k=1.


Reemplazamos los valores de la tabla de frecuencia en la ecuación anterior.


El Q1 de los datos agrupados es 119,48 cm. El 25% del conjunto de los estudiantes de primaria tiene una estatura de 119,48 cm o menor.
Cuartil 2 (Q2)
Calculamos el segundo cuartil (Q2), donde k=2.


Reemplazamos los valores de la tabla de frecuencia en la ecuación anterior.


El Q2 de los datos agrupados es 128,88 cm. El 50% del conjunto de los estudiantes de primaria tiene una estatura de 128,88 cm o menor. Observar que coincidí con el valor de la Mediana.
Cuartil 3 (Q3)
Calculamos el tercer cuartil (Q3), donde k=3.


Reemplazamos los valores de la tabla de frecuencia en la ecuación anterior.


El Q3 de los datos agrupados es 140,64 cm. El 75% del conjunto de los estudiantes de primaria tiene una estatura de 140,64 cm o menor.
Para mayor información, recomendamos este video en YouTube. Explicando paso a paso la realización de una Tabla de Frecuencia.
Quieres saber más Temas de Estadística, visita nuestro contenido Disponible:
Referencias
- Mario F. Triola., 2013. Estadística. 11ª Edición. Pearson Education. México.
- Para más Ilustración Visitar en ECURED: Tablas de frecuencias.