Por Qué Y Cómo Usar Ponderaciones En Encuestas Electrónicas

A menudo cuando hablo sobre la posibilidad de ponderar los datos obtenidos en encuestas veo una expresión de tipo ‘¿ein?’ en mi interlocutor. En este artículo intentaremos eliminar el halo de misterio que envuelve las ponderaciones en encuestas, y explicar en qué consisten y cuando pueden ser de utilidad.

Las bases: Muestra, Universo e Inferencia

Tras toda encuesta o estudio de mercado está la intención de conocer determinados parámetros (variables demográficas, percepciones, satisfacción de los clientes, conocimiento, etc.) de un determinado colectivo de personas. En estadística denominamos a ese colectivo el Universo. En el caso de utilizar encuestas, nuestra intención es obtener las respuestas a nuestras preguntas para así poder caracterizar el universo al que nos dirigimos.

Idealmente desearíamos poder obtener las respuestas de la totalidad del universo, pero esto raramente es así. A veces el número de personas que componen el universo es demasiado grande como para que sea viable encuestarlos a todos, otras veces no nos será posible llegar a determinados colectivos del universo. Para no complicar este artículo, dejaremos de lado el hecho que casi siempre habrá personas que no desearán ser encuestadas.

Si no podemos acceder a todo el universo, encuestaremos entonces a una parte de él. Llamamos a esta parte la Muestra, y nuestra intención será la de Inferir como es el universo a partir de los datos que obtengamos de la muestra.

Planteado así, resulta evidente que la definición de la muestra será un aspecto crítico para que la caracterización que mediante Inferencia hagamos del universo sea lo más parecida posible a la realidad del Universo.

Errores debidos a la composición de la Muestra

Los dos aspectos básicos a considerar al definir la muestra son Representatividad (o proporcionalidad) y Tamaño:

Representatividad/Proporcionalidad: La muestra debe ser representativa del universo que queremos caracterizar. Aunque dicho así resulte evidente, cuando llega el momento de encuestar esto a menudo se descuida.

Si deseamos caracterizar determinadas preferencias del ‘Ciudadano promedio’ no podremos limitarnos a encuestar a las personas de las tres principales ciudades, o sólo a los jóvenes o sólo a las mujeres.

Tamaño: Al hacer encuestas el tamaño importa… hasta cierto punto. Si de un colectivo de 100 personas, sólo preguntamos a 10 ¿hasta que punto será fiable la inferencia que hagamos? ¿Y si preguntamos a la mitad? ¿Y si el colectivo es de un millón de personas?

Aunque en este artículo no abordaremos como definir el tamaño de la muestra, dejaremos dos ideas: (1) Cuanto menor sea la muestra, mayor será el porcentaje de la misma al que será necesario preguntar, y (2) a partir de cierto tamaño de universo ya no es necesario aumentar en número de encuestas a realizar.

Función de las ponderaciones

El hecho de ponderar está relacionado con la parte de Representatividad/Proporcionalidad de la Muestra.
Idealmente, debemos dar a cada persona del universo la misma probabilidad de poder ser encuestada. Sólo así obtendremos una muestra que realmente refleje al universo que queremos caracterizar.

Cuando esto no sea así, bien porque no sea posible, bien porque en el diseño de la muestra entren otras consideraciones, podemos corregir estas desviaciones aplicando ponderaciones. Ponderar significa dar a cada persona encuestada un determinado peso dentro de la encuesta, que puede variar de persona a persona. Cuando no se aplican ponderaciones, lo que de hecho se está haciendo es dar el mismo peso (usualmente 1) a cada persona.

Veamos algunos ejemplos. Para ello utilizaremos el caso de un Multicine que dispone de varias salas que tendrán distinta afluencia de público (variará en función tanto de su de su aforo como del número de pases que haya en ellas). Nuestro objetivo es conocer el nivel de satisfacción de los clientes del Multicine. Supondremos también que las encuestas de satisfacción se realizan a la salida del Multicine, por la que irán pasando las personas de vayan saliendo de todas las salas.

1-. Valoración media del Multicine

Si analizamos las encuestas de satisfacción sin realizar ponderaciones, obtendremos la valoración media de las personas encuestadas. Pero la muestra de personas encuestadas puede no corresponderse con el universo de personas que han estado en las salas. Esto puede ser así cuando haya películas que terminen a la vez, cuando las encuestas se hagan únicamente en determinadas franjas horarias, etc.

En este caso, se podrían corregir estas desviaciones utilizando como criterio de ponderación el número de personas que ha visitado cada sala. El peso a aplicar a cada persona encuestada que ha estado en la sala Y sería:
(Número de personas que han estado en la sala Y) / (Número de encuestas hechas a personas de la sala Y)

2-. Valoración media con cuotas por sala

Otras veces la razón de la no representatividad de la muestra es debida al propio diseño de la misma. Si por ejemplo para una sala determinada se quiere hacer un análisis en mayor profundidad, entonces se necesitará una mayor muestra. Razones de presupuesto nos pueden disuadir de simplificar el escenario aumentando con la misma proporción la muestra del resto de salas.
En este caso, si no aplicáramos pesos, en el valor agregado estaría sobrerrepresentada la sala con mayor muestra. La corrección a realizar es la misma que en el punto anterior, aunque la razón de hacerlo es distinta.

3-. Valoración media de las salas

Supongamos ahora, que la dirección del Multicine no está interesada en conocer la valoración media de los visitantes, si no que la métrica que ha establecido como indicador es la media de las valoraciones de las salas.
En este caso, podríamos olvidarnos de las ponderaciones, calcular la satisfacción por sala y a continuación obtener su media aritmética… o bien aplicar el siguiente peso a cada persona que estado en la sala Y:
1 / (Número de encuestas hechas a personas de la sala Y)

4-. Valoración media según ingresos por sala

Finalmente imaginemos que la dirección quiere reflejar en las valoraciones el hecho de que los visitantes a salas con proyección de películas 3D han pagado un precio mayor (y que por tanto tienen una importancia mayor en la facturación), que las personas que van a ver películas de estreno y de las que han visto películas de reposición.
En este caso un posible criterio para las ponderaciones de cada persona que ha estado en la sala Y sería:
(Precio de la entrada de la sala Y) x (Número de personas que han estado en la sala Y) / (Número de encuestas hechas a personas de la sala Y)
Con esto obtendríamos el nivel medio de satisfacción del cliente por euro de facturación.

En este artículo se ha explicado la Ponderación como mecanismo de corrección en encuestas. Para ello primero se ha descrito la relación existente entre Universo y Muestra, para después describir posibles correcciones que se pueden hacer mediante la aplicación de ponderaciones.

Más información sobre encuestas electrónicas.