Cuando se describe un conjunto de datos, suelen utilizarse medidas de tendencia central y de variabilidad o dispersión. Las primeras (media, mediana y moda) muestran el punto central del conjunto de datos; por su parte, las segundas (desviación estándar, varianza, valores mínimo y máximo, entre otras) indican la dispersión o variación de los datos.
Media, moda y mediana
De acuerdo con Obando (2022), las medidas de tendencia central son estadísticas que resumen la información; entre ellas, se encuentran las siguientes:
Cada medida de tendencia central tiene sus ventajas y limitaciones, así que elegir la más adecuada dependerá del tipo de datos y del objetivo del análisis.
Observa esta colección de datos: {1, 2, 3, 4, 5, 6, 7, 8, 9}. Para calcular la medida de tendencia central llamada media aritmética o promedio, debes hacer lo siguiente:
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 = 45
La siguiente medida es la mediana; para calcularla, considera el siguiente conjunto de datos:
{2, 4, 10, 3, 1, 12, 5, 9, 7, 6, 11, 8, 13}
{2, 4, 10, 3, 1, 12, 5, 9, 7, 6, 11, 8, 13} -> {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13}
Como el valor central en la posición siete es precisamente el 7, este número equivale a la mediana, ya que hay una misma cantidad de datos antes y después que él. Sin embargo, el total de datos que contiene una serie también puede ser par y, por tanto, cambia la manera como se calcula esta medida.
En este caso, considera la siguiente colección con una cantidad par de valores: {1, 4, 3, 4, 2, 4, 5, 6, 7, 6, 8, 5}. El cálculo de la mediana se realiza de la siguiente manera:
{1, 4, 3, 4, 2, 4, 5, 8, 7, 6, 8, 5} -> {1, 2, 3, 4, 4, 4, 5, 5, 6 ,7, 8, 8}.
Ahora bien, encontrar la moda de un conjunto de datos resulta muy sencillo, solo necesitas esclarecer cuál es el valor que aparece con mayor frecuencia en la muestra. Para hacerlo, cuenta las veces que se repite cada elemento del conjunto de datos, pues aquel con mayor frecuencia será la moda.
Por ejemplo, examina esta colección {1, 4, 2, 4, 5, 3}. El valor que más veces se repite es el 4, por tanto, funciona como moda. Si hay un solo valor que se repite con mayor frecuencia que los demás, se dice que la muestra es unimodal.
Por su parte, cuando dos valores son los más recurrentes, la colección se denomina bimodal. Examina esta serie {2, 6, 7, 2, 3, 6, 9}. Como habrás observado, el 2 y el 6 se repiten dos veces cada uno, es decir, tienen la misma frecuencia; por tanto, se trata de un conjunto bimodal.
Mientras tanto, si la muestra tiene tres o más valores repetidos con mucha frecuencia, entonces se considera multimodal. Observa el siguiente conjunto de datos: {3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1}. Te habrás dado cuenta de que los números 1, 3 y 4 se repiten tres veces cada uno; por ende, al contar con la misma recurrencia, la colección es multimodal.
Otra manera de calcular la moda es la siguiente:
{1, 4, 3, 4, 2, 4, 5, 6, 7, 6, 8, 5}
1. Ordena los datos de menor a mayor:
{1, 4, 3, 4, 2, 4, 5, 6, 7, 6, 8, 5} -> {1, 2, 3, 4, 4, 4, 5, 5, 6, 6, 7, 8}
2. Cuenta las veces que se repite cada valor de la muestra y coloca dicha recurrencia en una lista de pares, la cual debe incluir valor y frecuencia.
{(1, 1), (2, 1), (3, 1), (4, 3), (5, 2), (6, 2), (7, 1), (8, 1)}
3. Analiza cuál de los valores tiene la mayor frecuencia; en este caso, se trata del 4. Por tanto, es el número que representa la moda de la colección.
Así como las medidas de centralización se utilizan para representar los datos con respecto a su posición, existen otras conocidas como medidas de dispersión. De acuerdo con Zapata (2022), estas se utilizan para medir la distancia que se encuentra entre cada uno de los datos con respecto a la media o promedio.
Varianza y desviación estándar
Entre las medidas de dispersión se encuentran las siguientes:
Donde:
Observa la siguiente colección de datos:
Para el ejemplo anterior, la desviación estándar se obtiene de esta forma:
Es indispensable representar los datos en su totalidad, ya que esto facilita su correcta descripción y estudio. Entre las maneras de analizar un conjunto de valores, se encuentran las medidas de posición o centralización, como la media aritmética o promedio, que resume el total de elementos; el mejor ejemplo se da con las notas escolares, ya que con esta medida se conoce la calificación general. Por otro lado, las medidas de dispersión evidencian que tan cerca o lejos se encuentran todos los datos en relación con el valor central. En conjunto, ambos tipos de medidas permiten tener información de los datos estudiados.
Asegúrate de: