Hay un cierto sentimiento de inevitabilidad entre los profesionales de la investigación social acerca del uso de Internet como plataforma para realizar encuestas. Determinadas áreas de estudio quizás no tengan más remedio que convivir con las bajas tasas de respuesta o el elevado coste de hacer entrevistas en persona o por teléfono. Sin embargo, para algunos temas, y quizás la opinión pública es el mejor ejemplo y el que más nos interesa aquí, Internet es ya una alternativa consolidada, cada vez menos extraña a los investigadores y al público. No hay más que mirar a los estudios que se han publicado en las últimas semanas sobre el Brexit para ver que una alta proporción de trabajos de campo que llegan a los medios están hechos con muestras recogidas en Internet. Sin embargo, a pesar de su creciente popularidad, el problema es que todavía no sabemos cómo utilizar Internet para hacer encuestas.
La dificultad con la que los investigadores están batallando se puede resumir en que no tenemos todavía un instrumental para tomar muestras aleatorias en Internet. Es decir, el problema con el que nos encontramos está en adaptar la caja de herramientas que hace que las encuestas sean un instrumento viable de medición social a un entorno como el de Internet en el que no podemos, por ejemplo, tomar un listado de toda la gente en la población de interés y decidir aleatoriamente a quién contactar. Aún más, aunque tal listado existiese, todavía tendríamos que lidiar con las peculiaridades de un medio que favorece la comunicación indirecta y diferida, lo cual dificulta verificar la identidad, las características del entrevistado, o incluso garantizar que algunas respuestas sean espontáneas.
Por supuesto, hay muchas alternativas para sortear estas dificultades, algunas mejores otras peores, pero mi impresión es que la investigación sobre muestras no-probabilisticas, a pesar de los avances de los últimos años, está todavía rascando en la superficie del problema. Y a pesar de eso, a pesar de estar tanteando el terreno un poco a oscuras, lo más fascinante es que las encuestas por Internet están produciendo resultados que deberían llevarnos a ser optimistas. Podemos mirar las predicciones electorales que han ido produciendo los últimos años en Reino Unido o Estados Unidos (y no nos engañemos, todos utilizamos este tipo de encuestas como forma de evaluación de calidad de una metodología) y comprobaremos que todos los modos de entrevista (teléfono, en persona, Internet) producen resultados más o menos similares. Sí, las encuestas por Internet fallan, pero si fallan lo hacen de un modo parecido al resto de estudios. No solo eso, lo hacen por motivos comparables a otros modos. Es decir, a través de sus aciertos y sus errores empezamos a ver que las encuestas online capturan las mismas tendencias que sus equivalentes offline, eso pesar de que las críticas a su mal uso (a su abuso, más bien) han crecido en los últimos tiempos.
Pero es un poco absurdo tratar todas las encuestas por Internet como si fuesen una entidad homogénea, porque no es el caso. Diferentes encuestadores han tomado diferentes rutas para resolver los problemas de representatividad y eso ha llevado a formas muy diferentes plantear los trabajos de campo y el muestreo. Por eso, algo como mirar el modo de la entrevista y el tamaño de la muestra ya no es suficiente para entender los resultados.
Sin ánimo de ser exhaustivo, uno podría clasificar los modelos actuales para la realización de investigación online en tres tipos diferentes. La estrategia más conservadora ha tratado de emular el planteamiento de los estudios offline y consiste en crear un panel de individuos construido de tal manera que sea representativo de la población (contenga a proximadamente tantos hombres como mujeres, una proporción en cada grupo de edad comparable a la de la población, …) y del que el encuestador pueda hacer muestras aleatorias mediante invitaciones a participar en estudios. Otras empresas han seguido la ruta de los opt-in panels (paneles por subscripición), en los que los individuos entran y salen del panel a su discreción y corresponde al encuestrador corregir las discrepancias entre la distribución sociodemográfica de cada muestra y la de la población, aprovechando la estructura panel para tener una perspectiva más completa de las características de cada entrevistado. Finalmente, otras empresas adoptan estrategias más arriesgadas en las que no existe un panel permanente, sino que los usuarios reciben una única encuesta, y por tanto dependen crucialmente del volumen de respuestas para hacer las correcciones necesarias y convertir una convenience sample en una muestra representativa.
Internet parece el paso natural para la investigación social. Es rápido, es barato y permite un acceso casi universal y menos intrusivo a la población de interés que cualquier otro modo de entrevista. Pero la necesidad de adaptarse a Internet ha ido mucho más rápido que la disponibilidad de resultados teóricos sólidos que guien la investigación, con lo que las polémicas son casi una necesidad. Con el creciente interés en el uso de datos orgánicos como complemento a las encuestas tradicionales, seguramente muchas de las carencias actuales se irán solucionando ya que ambos tipos de datos no dejan de tener problemas con una raiz teórica similar.
Me voy a permitir la impertinencia de trasladarle los resultados de mi absurda facilidad para encontrar gazapos.
En el tercer párrafo:
– «no-probabilísticos» (la tilde)
– …eso «a» pesar de…
En el cuarto párrafo:
– …formas muy diferentes «de» plantear…
En el quinto párrafo:
– (contenga a proximadamente…
En el último párrafo:
– que guíen (la tilde)
Son nimiedades que para nada dificultan la comprensión del texto, pero lo afean.
Un saludo
La verdad es que no se me ocurre como evitar muestras sesgadas en Internet.
Creo que a la larga, los que quieran estudios serios seguirán necesitando el sistema tradicional de entrevistas a pie de calle o por teléfono para obtener muestras representativas.
Internet va a ayudar mucho daño permitiendo hacer encuestas de chiste pero que sirven para crear opinión.
El peligro es que se confundan encuestas serias con la tontería de las encuestas en al web. Incluso en televisión abusan de encuestas anecdóticas, al pie de calle con media docena, o llamadas de teléfono. Al principio decían «Hemos hecho una encuesta a pie de calle, aunque no es válida estadísticamente…», pero soltaban el dato. Últimamente, algunas veces incluso se saltan el «no es válida».
Auguro que el futuro de las encuestas se parecerá mucho al presente: los resultados dependerán del medio que las paga y, cuando lleguen las elecciones, todas la seguirán pifiando.
Las muestras son igualmente manipuladas, ya sean tradicionales u online. El autor se olvida del efecto vagón.