Sovint quan parlo sobre la possibilitat de ponderar les dades obtingudes en enquestes veig una expressió de tipus ‘ein?’ En el meu interlocutor. En aquest article intentarem eliminar l’halo de misteri que envolta les ponderacions en enquestes, i explicar en què consisteixen i quan poden ser d’utilitat.
Les bases: Mostra, Univers i Inferència
Darrera tota enquesta o estudi de mercat hi ha la intenció de conèixer determinats paràmetres (variables demogràfiques, percepcions, satisfacció dels clients, coneixement, etc.) d’un determinat col·lectiu de persones. En estadística, anomenem a aquest col·lectiu l’Univers. En el cas d’utilitzar enquestes, la nostra intenció és obtenir les respostes a les nostres preguntes per així poder caracteritzar l’univers al qual ens dirigim.
Idealment voldríem poder obtenir les respostes de la totalitat de l’univers, però això rarament és així. A vegades el nombre de persones que componen l’univers és massa gran com perquè sigui viable enquestar-los a tots, altres cops no ens serà possible arribar a determinats col·lectius de l’univers. Per no complicar aquest article, deixarem de banda el fet que gairebé sempre hi haurà persones que no desitjaran ser enquestades.
Si no podem accedir a tot l’univers, aleshores n’enquestarem a una part. Anomenem a aquesta part la Mostra, i la nostra intenció serà la d’Inferir com és l’univers a partir de les dades que obtinguem de la mostra.
Plantejat així, resulta evident que la definició de la mostra serà un aspecte crític per tal que la caracterització que mitjançant l’inferència fem de l’univers sigui el més semblant possible a la realitat de l’Univers.
Errors deguts a la composició de la Mostra
Els dos aspectes bàsics a considerar en definir la mostra són la Representativitat (o proporcionalitat) i la Mida:
Representativitat / Proporcionalitat: La mostra ha de ser representativa de l’univers que volem caracteritzar. Encara que dit així resulti evident, quan arriba el moment d’enquestar això sovint es descuida.
Si volem caracteritzar determinades preferències del “Ciutadà mitjà”, no podrem limitar-nos a enquestar les persones de les tres principals ciutats, o només als joves o només a les dones.
Mida: En fer enquestes la mida importa … fins a cert punt. Si d’un col·lectiu de 100 persones, només preguntem a 10 ¿fins a quin punt serà fiable la inferència que en fem? ¿I si preguntem a la meitat? ¿I si el col·lectiu és d’un milió de persones?
Encara que en aquest article no abordarem com definir la mida de la mostra, deixarem dues idees: (1) Com més petita sigui la mostra, més gran serà el percentatge de la mateixa al qual serà necessari preguntar, i (2) a partir de certa grandària de l’univers ja no és necessari augmentar la mida de la mostra (nombre d’enquestes a realitzar).
Funció de les ponderacions
El fet de ponderar està relacionat amb la part de Representativitat / Proporcionalitat de la Mostra.
Idealment, hem de donar a cada persona de l’univers la mateixa probabilitat de poder ser enquestada. Només així obtindrem una mostra que realment reflecteixi l’univers que volem caracteritzar.
Quan això no sigui així, bé perquè no sigui possible, o bé perquè en el disseny de la mostra entrin altres consideracions, podem corregir aquestes desviacions aplicant ponderacions. Ponderar significa donar a cada persona enquestada un determinat pes dins de l’enquesta, que pot variar de persona a persona. Quan no s’apliquen ponderacions, el que de fet s’està fent és donar el mateix pes (usualment 1) a cada persona.
Vegem alguns exemples. Per a això utilitzarem el cas d’un Multicine que disposa de diverses sales que tindran diferent afluència de públic (variarà tant en funció de l’aforament com del nombre de sessions que s’hi facin). El nostre objectiu és conèixer el nivell de satisfacció dels clients del Multicine. Suposarem també que les enquestes de satisfacció es realitzen a la sortida del Multicine, per on aniran passant les persones de vagin sortint de totes les sales.
1-. Valoració mitjana del Multicine
Si analitzem les enquestes de satisfacció sense fer ponderacions, obtindrem la valoració mitjana de les persones enquestades. Però la mostra de persones enquestades pot no correspondre amb l’univers de persones que han estat a les sales. Això pot ser així quan hi hagi pel·lícules que acabin a la mateixa hora, o bé quan les enquestes es facin únicament en determinades franges horàries, etc.
En aquest cas, es podrien corregir aquestes desviacions utilitzant com a criteri de ponderació el nombre de persones que ha visitat cada sala (que podem obtenir de la venda d’entrades). El pes a aplicar a cada persona enquestada que ha estat a la sala I seria:
(Nombre de persones que han estat a la sala I) / (Nombre d’enquestes fetes a persones de la sala I)
2-. Valoració mitjana amb quotes per sala
Altres cops la raó de la no representativitat de la mostra és deguda al propi disseny de la mateixa. Si per exemple per a una sala determinada es vol fer una anàlisi en major profunditat, llavors es necessitarà una major mostra. Raons de pressupost ens poden dissuadir de simplificar l’escenari d’augmentar amb la mateixa proporció la mostra de la resta de sales.
En aquest cas, si no apliquéssim pesos, en el valor agregat estaria sobrerepresentada la sala amb més mostra. La correcció a realitzar és la mateixa que en el punt anterior, encara que la raó de fer-ho és diferent.
3-. Valoració mitjana de les sales
Suposem ara, que la direcció del Multicine no està interessada en conèixer la valoració mitjana dels visitants, sinó que la mètrica que ha establert com a indicador és la mitjana de les valoracions de les sales.
En aquest cas, podríem oblidar-nos de les ponderacions, calcular la satisfacció per sala i a continuació obtenir la seva mitjana aritmètica … o bé aplicar el següent pes a cada persona que estat a la sala I:
1 / (Nombre d’enquestes fetes a persones de la sala I)
4-. Valoració mitjana segons ingressos per sala
Finalment imaginem que la direcció vol reflectir en les valoracions el fet que els visitants a sales amb projecció de pel·lícules 3D han pagat un preu més alt (i que per tant tenen una importància major en la facturació) que les persones que van a veure pel·lícules d’estrena i de les que han vist pel·lícules de reposició.
En aquest cas un possible criteri per a les ponderacions de cada persona que ha estat a la sala I seria:
(Preu de l’entrada de la sala I) x (Nombre de persones que han estat a la sala I) / (Nombre d’enquestes fetes a persones de la sala I)
Amb això obtindríem el nivell mitjà de satisfacció del client per euro de facturació.
En aquest article s’ha explicat la Ponderació com a mecanisme de correcció en enquestes. Per a això primer s’ha descrit la relació existent entre Univers i Mostra, per després descriure possibles correccions que es poden fer mitjançant l’aplicació de ponderacions.
Més informació sobre enquestes electròniques.