Contexto
No está en casa
Encontrar personas que estén dispuestas a responder una encuesta es más complicado en estos tiempos que anteriormente. Con los problemas de inseguridad y miedo a proporcionar cualquier tipo de información personal, cada vez son más las personas que se reúsan a responder una encuesta que hace incluso 5 años atrás.
Los investigadores deben recurrir ahora a un rapport más explicativo y tratar de aumentar su credibilidad para hacer que algunas personas decidan iniciar una encuesta. Incluso, ya que la han iniciado, lograr que la finalicen proporcionando todos sus datos y llegando hasta el final es todo un reto.
Eso sin contar la enorme cantidad de personas que ni quiera dan la oportunidad de contactarles: no responden el teléfono, no salen de su casa o se hacen a un lado al tratar de abordarlos.
Todo lo anterior tiene implicaciones importantes en la determinación del tamaño de muestra. No tan sólo son consideraciones en el tamaño en sí de la muestra, sino en la dificultad de encontrar a los respondientes adecuados y hacerlos permanecer lo suficiente y dando respuestas veraces.
Lo más duro, en el futuro se espera que esta dificultad vaya en aumento, al menos en nuestro país.
Preguntas detonadoras o de reflexión:
¿Qué implicaciones estadísticas crees que tenga el que una persona no responda la totalidad de una encuesta?, ¿de qué tipo?
Si cierto tipo de personas son más difíciles de contactar, ¿cómo crees que esto impacte el tamaño de muestra?
Explicación
Tamaño de muestra
Cuando se conduce una investigación de mercados, el propósito del investigador no es precisamente el de describir la muestra de respondientes, sino hacer inferencias hacia la población (Zikmund, 2014). Una población es el conjunto total o potencial de unidades para ser observadas (todos los elementos) mientras que la muestra es una pequeña parte de ella.
Al proceso de realizar generalizaciones a partir de los resultados obtenidos con una muestra se le conoce con el nombre de inferencia estadística (Malhotra, 2008). De hecho, se selecciona sólo una muestra de un tamaño preestablecido y se calculan sus estadísticos (media y proporción, por ejemplo). Aquí, el concepto de distribución del muestreo es relevante ya que nos permite utilizar la teoría de la probabilidad para hacer inferencias sobre los valores de la población.
Se conoce con el nombre de distribución de muestreo a los valores de una muestra estadística, calculados para cualquier posible muestra que pueda ser extraída de una población meta, dado un plan específico de muestreo. En otras palabras, si se debe obtener una muestra de 5 tiendas de una población de 20, puede obtenerse de (20 x 19 x 18 x 17 x 16) /(1 x 2 x 3 x 4 x 5) o 15 504 diferentes maneras, todas ellas del tamaño de 5. Las distintas distribuciones de frecuencias obtenidas con los distintos valores de las medias de estas 15 504 muestras distintas especificarían la distribución del muestreo de la propia media.
En muestras grandes, superiores a 30 elementos, las propiedades serían las siguientes (Malhotra, 2008):
O en casos donde se pueda calcular a partir de s, el error estándar de la media se convierte en:
Si suponemos que no hay error de medición, será posible evaluar la confiabilidad de la estimación del parámetro de la población en términos del error estándar.
El cálculo de los valores z para proporciones se hace de la misma manera.
Para determinar el tamaño de muestra deben tomarse en consideración diversos factores, como la importancia de la decisión, la naturaleza de la investigación, la cantidad de variables, y otros muchos mencionados en temas anteriores.
Sin embargo, la determinación estadística del tamaño de muestra final de una muestra es el resultante después de haber eliminado a encuestados potenciales que no reunieron las condiciones o que no concluyeron la entrevista (Zikmund, 2014).
Dependiendo de las tasas de incidencia y terminación es posible que el tamaño inicial de la muestra sea mucho más elevado que el tamaño final de la muestra. En ocasiones, limitaciones de tiempo, dinero y experiencia influyen de manera significativa en el tamaño final.
Malhotra (2008) basa la determinación del tamaño de muestra en la inferencia estadística tradicional, fundamentado en la construcción de intervalos de confianza alrededor de medias o proporciones de la muestra. El cálculo de dichos intervalos de confianza implica determinar distancias por debajo y por arriba
de la media de la población
que contiene un área especificada de la curva normal.
Lo pasos para determinar el tamaño de muestras (en medias y proporciones) son los siguientes:
Para efectos prácticos, estos pasos se llevan a cabo de la siguiente manera para MEDIAS:
El mismo proceso para PROPORCIONES es el siguiente:
Los intervalos de confianza se construyen alrededor de los datos obtenidos en el proceso de determinación del tamaño de muestra. Sirven para definir el nivel de precisión que en realidad se obtuvo (Malhotra, 2008; Zikmund, 2014).
Continuando con el ejercicio de las medias, en el que se utilizó un valor de estimado de $55.00 para porque el valor real de la población era desconocido, se obtuvo una muestra n = 465 que y éstas generaron una media
de 180.00 y una desviación estándar de la muestra s de 50.00.
El intervalo de confianza entonces sería el siguiente:
En el caso de las proporciones, se calcula de la siguiente manera:
Continuando con el ejemplo:
El intervalo de confianza es entonces:
La determinación estadística de un tamaño de muestra representa la cantidad total final que debe tenerse de encuestas, entrevistas u observaciones para asegurarse que los parámetros se están calculando con el nivel de confianza planeado y el grado de precisión deseado.
Esto significa que para obtener dicha cantidad total como muestra, el tamaño inicial de la misma debe ser un tanto más elevado ya que comúnmente, la tasa de incidencia y la tasa de terminación no llegan al 100%.
La tasa de incidencia se refiere al porcentaje de personas elegibles para participar en el estudio (Malhotra, 2008). Está determinado por la cantidad de personas que se deben contactar para lograr un determinado tamaño de muestra. Por lo general, debemos contactar un mayor un mayor número de personas que las indicadas en la muestra para lograr una entrevista válida.
Otra consideración importante es la tasa de terminación, que se refiere al porcentaje de encuestados calificados que terminan o concluyen la entrevista.
En conjunto, la tasa de incidencia y la tasa de terminación indican que el número de encuestados potenciales contactados, es decir, el tamaño de muestra inicial.
De esta manera, el tamaño de muestra inicial indica la cantidad de elementos que deben muestrearse con la intención de lograr el tamaño de muestra final deseado.
Para tratar de disminuir la brecha entre el tamaño de muestra inicial y el tamaño de muestra final, es necesario tratar de mejorar la tasa de respuesta y realizar algunos ajustes cuando nos topamos con falta de respuesta.
Las estrategias para realizarlo se resumen en la siguiente gráfica (Malhotra, 2008):
Así, debido a que tener baja tasa de respuesta aumenta la probabilidad de sesgo por falta de respuesta, lo mejor siempre es mejorarla. Las dos principales razones por las que se tiene una baja tasa de respuesta son los rechazos y la falta de respuesta (nadie responde).
Los rechazos pueden darse por dos motivos: el elemento no tiene disposición para responder o es incapaz de hacerlo. Para mejorarlo se aplican las 6 estrategias indicadas en la gráfica de arriba.
En cambio, cuando no se obtiene una respuesta, se debe principalmente a que no hay nadie en casa para responder. La forma de mejorarlo es simplemente haciendo una serie de repeticiones de llamadas o intentos de seguimiento para hacer contacto con quienes no han podido responder.
Por otro lado, cuando ya nos enfrentamos a una situación en la que no se respondió, es necesario calcular los efectos del posible sesgo que se tiene. Incluso, cuando no es posible calcular este sesgo, es necesario hacer algunos ajustes en el análisis y la interpretación de los datos. Algunas formas de realizar estos ajustes se enlistan a continuación: (Malhotra, 2008)
Submuestreo de quienes no respondieron: estableciendo contacto con una submuestra de personas que no respondieron, puede ser a través de entrevistas personales o telefónicas.
En el reemplazo: los elementos que no respondieron en una encuesta actual se sustituyen con personas que no contestaron en una encuesta anterior similar.
En la sustitución: se cambia a los elementos que no responden por otros elementos del marco de muestreo con la intención de que estos últimos sí contesten.
Estimaciones subjetivas: Cuando no es factible el uso de ninguna de las tres opciones anteriores, se pueden hacer estimaciones subjetivas de la naturaleza y efecto del sesgo por falta de respuesta.
El análisis de tendencias: intenta discernir alguna tendencia entre los primeros y los últimos encuestados. Esta tendencia se extrapola a quienes no respondieron para estimar su posición en la característica de interés.
La ponderación: busca considerar la falta de respuesta mediante la asignación de valores diferenciales a los datos según las tasas de respuesta.
La imputación: atribuye característica de interés a quienes no respondieron, basándose en la similitud de las variables disponibles tanto para quienes no respondieron como para los que sí lo hicieron.
Cierre
En este punto del proceso ya tenemos toda la planeación completa del proyecto de investigación de mercado. Hemos determinado la información requerida, hemos visto qué se requiere para obtenerla. Incluso, ya hemos diseñado el instrumento de medición adecuado, sabemos a quién investigar (elementos) y ahora, sabemos cuántos necesitamos para tener una precisión exacta en los resultados esperados y qué herramientas utilizar para tratar de maximizar la tasa de respuesta.
Este punto no es sencillo, se requieren bases estadísticas para el cálculo del tamaño de muestra y conocimientos del teorema de distribución normal para entender los intervalos de confianza. Además, es necesario contar con habilidades y creatividad para mejorar las tasas de respuesta. En este tema se aprecia claramente por qué se dice que la mercadotecnia es un arte y una ciencia al mismo tiempo.
El siguiente reto a enfrentar ahora es el trabajo de campo, es decir, la ejecución del muestreo.
Checkpoint
Antes de concluir el tema, asegúrate de poder contestar las preguntas que se enlistan a continuación.
Haz clic en cada pregunta para conocer su respuesta .
Estimar el promedio de una población con un único valor resulta en un estimador puntual. Los intervalos de confianza estiman un rango de números entre los cuales el investigador puede tener la certeza de que la media de la población se encuentra ahí. El intervalo de confianza es un porcentaje que indica la probabilidad de que un estimado del intervalo de confianza será el correcto.
Muchos problemas de investigación se resuelven con proporciones. Las técnicas estadísticas para determinar el intervalo de confianza de proporciones nos llevan a las mismas conclusiones.
La determinación estadística del tamaño de muestra requiere considerar los siguientes:
Referencias
Libro de apoyo:
Glosario
Corrección de la población finita (cpf). Es la corrección a la sobreestimación de la varianza del parámetro de la población (media o una proporción) cuando el tamaño de la muestra es 10 por ciento o más del tamaño de la población.
Distribución de muestreo. Valores de una muestra estadística, calculados para cualquier posible muestra que pueda ser extraída de una población meta, dado un plan específico de muestreo.
Estadístico. Es una descripción resumida de una característica o medida de la muestra; se utiliza como una estimación del parámetro de la población.
Inferencia estadística. Proceso de realizar generalizaciones a partir de los resultados obtenidos con una muestra.
Intervalo de confianza. Es el rango dentro del que caerá el verdadero parámetro de la población, suponiendo un determinado nivel de confianza.
Nivel de confianza. Es la probabilidad de que un intervalo de confianza incluya el parámetro de la población.
Nivel de precisión. Es el tamaño deseado del intervalo al estimar el parámetro de la población usando el estadístico de la muestra. Es la máxima diferencia permisible entre el estadístico de la muestra y el parámetro de la población.
Parámetro. Descripción resumida de una característica o medida fija de una población meta.
Tasa de incidencia. Porcentaje de personas elegibles para participar en el estudio
Tasa de terminación. Se refiere al porcentaje de encuestados calificados que terminan o concluyen la entrevista.