“Alex Char se ubica detrás de Gustavo Petro en intención de voto en nueva encuesta presidencial”, es el titular usado por varios medios de comunicación como Infobae o Tu Bogotá. “En la encuesta de Medilab somos la primera opción de la Coalición de la Esperanza. Gracias a los colombianos que creen en nuestra opción de centro sin tibiezas”, escribe el precandidato Alejandro Gaviria en una publicación de Facebook.
En este año electoral abundan las mediciones y encuestas, pero no todas son igualmente confiables. Para brindar mejores mecanismos para tomar decisiones, en Colombiacheck hicimos este explicador sobre cómo deben interpretarse las encuestas, con algunos trucos para calibrar estas publicaciones que pretenden pronosticar posibles resultados de las consultas interpartidistas, así como de los comicios presidenciales y legislativos.
Se debe tener claro qué es una encuesta, cuál es su ficha técnica (un punto vital) y hasta cuál es la empresa encuestadora porque debe ser una firma aprobada por el Consejo Nacional Electoral (CNE). No cualquier diagrama de barras que circula en redes sociales es confiable y, aún sí lo es, hay que mirar los números con rigor.
En el caso de Gaviria, él y su campaña han difundido encuestas “fantasma” de una supuesta agencia llamada Medialab, de cuya existencia legal o digital no hay rastro. La ficha técnica tampoco cumple con los requisitos que rigen estos estudios de opinión en Colombia y no es la primera vez que su candidatura mueve este tipo de desinformación.
La sacada de pecho de Char no se queda atrás. La nota adjunta incluso dice que “pese a la dura polémica que actualmente enfrenta Alejandro ‘Alex’ Char por el caso de corrupción política e infidelidad amorosa que reveló la excongresista fugitiva Aída Merlano, tal parece que no le afectó electoralmente, dado que en la más reciente encuesta que mide la intención de voto a la Presidencia, el exalcalde barranquillero ocupa el segundo puesto”.
Sin embargo, al revisar la ficha técnica de esta encuesta, la fecha del trabajo de campo es del 13 de enero al 4 de febrero de 2022. El cuestionario se dejó de aplicar justo el día en el que la revista Semana reveló los chats entre Merlano y Char y dos días antes de la entrevista dada por la condenada exrepresentante a Cambio, un nuevo medio de comunicación digital.
Además, la única entidad que responde por los resultados es el Centro Estratégico Latinoamericano de Geopolítica (Celag), un tanque de pensamiento internacional que, según su página de internet, tiene en su “consejo consultivo” al también precandidato presidencial Gustavo Petro, líder de la intención de voto en esta encuesta con mayor diferencia que en otras recientes. También está el expresidente ecuatoriano Rafael Correa.
Además, su director, Alfredo Serrano Mancilla, es autor de libros como “El pensamiento económico de Hugo Chávez” y “¡A Redistribuir! Ecuador para Todos”, columnista del medio estatal ruso RT, bloguero del medio multiestatal Telesur y exasesor económico de Nicolás Maduro, quien lo bautizó como El Cristo de la Economía. Mancilla también era el enlace con Neurona Marketing, una agencia ligada a Podemos en España y la Constituyente de Evo Morales en Bolivia, pero que prestó sus servicios a clientes políticos de izquierda en toda Latinoamérica, con varias investigaciones por cobros por servicios no prestados.
Entonces, ¿qué es una encuesta y cómo funciona? ¿Cuáles son las normas que las rigen en el contexto electoral colombiano y quién las vigila? ¿Qué hay que tener en cuenta al analizarlas para entender qué tan confiables son los datos? A continuación, la respuesta a algunas de estas preguntas.
En esencia, una encuesta es una técnica de investigación que se puede usar con diversos fines. En este caso, es una forma de estudiar la opinión pública para saber lo que la gente está pensando sobre un tema: los comicios de 2022 en Colombia.
Un artículo del Centro de Estudios de Opinión de la Universidad de Antioquia (2009) citaba, entre otras, la siguiente definición de uno de los precursores del uso de estos instrumentos para analizar campañas electorales, el sociólogo Paul Lazarsfeld (1901-1976):
“La encuesta es un método de recolección de información, que, por medio de un cuestionario, recoge las actitudes, opiniones u otros datos de una población, tratando diversos temas de interés. Las encuestas son aplicadas a una muestra de la población objeto de estudio, con el fin de inferir y concluir con respecto a la población completa”.
Para que esto último sea posible, una de las características principales es que la muestra, por definición, debe ser representativa. Esto quiere decir que, aunque no incluye a todas las personas colombianas mayores de 18 años habilitadas para votar (el universo del censo electoral), debe estar compuesta por un subconjunto de quienes cumplen esa definición que esté compuesto de forma similar al total.
Tal representatividad se puede conseguir por diferentes métodos. Un elemento clave es el azar, que permite que cada votante potencial tenga la misma probabilidad de ser encuestado. También se puede usar la estratificación, en la que se establece un número de entrevistas por regiones o grupos específicos (por ejemplo, según género, edad o situación socioeconómica) para que se ajuste a la realidad del país o región en estudio.
Además, como se detalla más adelante, el tamaño de la muestra sí importa.
Todo esto requiere una planeación técnica, contrario a lo que sucede con los sondeos de opinión. Estos no se fundamentan en cálculos de probabilidad, por lo que pueden usar muestras pequeñas para obtener resultados más inmediatos. Así lo recordó el CNE en su circular 4 de 2019.
De acuerdo con la Constitución, el CNE es la entidad encargada de “velar por el cumplimiento de [...] las disposiciones sobre publicidad y encuestas de opinión política”, entre otras normas relativas a los comicios en el país. En particular, el Estatuto de Partidos Políticos señala las características generales con las que deben cumplir las encuestas electorales publicados por cualquier medio:
“Toda encuesta de opinión de carácter electoral al ser publicada o difundida, tendrá que serlo en su totalidad y deberá indicar expresamente la persona natural o jurídica que la realizó y la encomendó, la fuente de su financiación, el tipo y tamaño de la muestra, el tema o temas concretos a los que se refiere, las preguntas concretas que se formularon, los candidatos por quienes se indagó, el área y la fecha o período de tiempo en que se realizó y el margen de error calculado”.
Enseguida prohíbe la publicación de estos estudios el mismo día de las votaciones, lo que se conoce como encuestas a boca de urna en otros países. También se reafirma la autoridad del CNE para verificar que las preguntas “no sean formuladas de tal forma que induzcan una respuesta determinada”.
Además, la Ley de Garantías (2005) amplió la prohibición de las encuestas a 15 días antes de las elecciones presidenciales. Por otro lado, estableció el Registro Nacional de Encuestadores que debe llevar el Consejo Nacional Electoral, que es donde se deben inscribir las firmas encuestadoras para poder publicar sus resultados con renovación cada dos años, como exige la resolución 50 de 1997.
En el corte más reciente, a diciembre de 2021, había 92 firmas autorizadas. Ni la tal Medialab y ni el Celag hacen parte de esa lista.
Desde antes, el reglamento del CNE para estas compañías (1996) les exige acreditar ante él su existencia y representación legal, experiencia y referencias de medios u otras instituciones que dieran fe de su trabajo. También deben entregar copia de los resultados con las especificaciones técnicas correspondientes.
Las mismas normas establecen sanciones por infringir los puntos anteriores. Las multas, en los casos más graves, pueden ser de hasta 200 salarios mínimos mensuales e incluso se contempla la suspensión o prohibición de hacer o publicar más encuestas.
La encuesta de Medialab que favorece a Gaviria en su coalición, por ejemplo, tiene una ficha técnica donde no dice nada sobre su financiación, el margen de error ni otros datos exigidos por la ley. La del Celag que pone a Char de segundo entrega más información, pero no de manera detallada y tampoco dice cómo se financió.
Usando las herramientas matemáticas y de periodismo de datos brindadas por la periodista e instructora en periodismo de datos Sandra Crucianelli en sus cursos de cobertura electoral (1, 2, 3), podemos evaluar la calidad de las encuestas. Empecemos por los principales defectos que podría tener una consulta estadísticas.
Para un estudio nacional, con una confiabilidad de más del 95% y un error de no más del 3%, cada pregunta de la encuesta debe ser respondida por al menos 1.067 personas. Debajo de ese número, el error es más alto que el admisible, dice la formadora, y a mayor tamaño de la muestra, menor posibilidad de error.
Así que para predecir con un error del 1% deberían hacerse 10.000 encuestas y para el 0,5% debe subirse a 38 mil. Lo que hace tan difícil predecir resultados muy ajustados, pues no suelen hacerse encuestas con muestras tan grandes.
Esto es según la fórmula:
m = Z²*p*q/e²
Donde m es el tamaño de la muestra de la encuesta; Z es la constante estadística de valor 1,96 (para una confianza de 95%); mientras que p y q son la posibilidad de que algo ocurra (50% de cada lado) y finalmente e sería el error esperado.
Así m = (1,96)² * 0,5 * 0,5 / (0,03)² = 1.067 encuestas.
Ahora, Z también aumenta según el nivel de confianza que se busca. Por ejemplo, si se quisiera aumentarla al 99%, este coeficiente tendría que subir a 2,576 y, por tanto, el número de encuestas tendría que ser mucho mayor, al menos 1.844 pero deberán ser aún más si se quiere reducir el margen de error.
Para calcular o comprobar el margen de error presentado en una encuesta, que tiene que ver con la precisión de elegir la muestra de forma adecuada para que sea representativa según el tamaño de la población y la confianza, despejando de la fórmula de la muestra ya presentada, entonces
e = Z²*p*q/m
Esto puede calcularse también en esta herramienta, considerando un censo electoral de 38.893.318 personas para el 19 de enero de 2022, según la Registraduría.
Un margen de error ideal no debería superar el 3%, pero puede ser aceptable hasta un máximo de 5%. Siguiendo las fórmulas anteriores, esto quiere decir que ninguna encuesta debe consultar una cantidad menor de 384 personas.
En cada caso, hay que comprobar con la fórmula que el error expresado por la encuesta es el verdadero. Por ejemplo, estos datos cuadran en la del Celag (Char de segundo), mientras que la de Medialab (Gaviria líder de su coalición) ni siquiera da la información suficiente para hacer esta comprobación.
Lo anterior, sin embargo, no basta. Además, existe un concepto de “mortalidad de la muestra” que señala que estos estudios de campo deben hacerse entre 5 y 7 días. Las opiniones varían durante la campaña en poco tiempo, por lo que se necesita un tiempo mínimo para que se consideren “fijadas” pero también un máximo para que los datos no pierdan vigencia.
La encuesta del Celag, por ejemplo, aplicó el cuestionario durante más de tres semanas. Esto quiere decir que no refleja un momento claro de la campaña sino una acumulación de opiniones, incluyendo un número indeterminado de entrevistas envejecidas.
En este momento no deberá sólo tomarse las proyecciones poblacionales oficiales, sino la diáspora y el aumento de la pobreza. La muestra debe haber sido tomada entre 5 y 7 días, más de eso ya la misma persona pudo haber cambiado de opinión. Si la encuesta fue 30 días o más antes de la elección, no predice, es diagnóstica. Con un mes o menos, se puede prever resultados.
Demasiados indecisos
La cantidad de personas que aún no se ha formado una opinión sobre un tema son los indecisos. En una encuesta confiable estos no deben ser más del 20% de la muestra, pues no permite hacer predicción y si es más del 30%, la encuesta no tiene ninguna validez, señala Crucianelli.
Advierte la experta que vale considerar que un indeciso es “No sabe”, pero “No contesta” puede entrar en quienes no quieren responder, que usualmente ha sido señalado por encuestadores como voto escondido, que ha alterado sus predicciones, especialmente en casos como la elección de Donald Trump como presidente o el Brexit.
Un error común es distribuir el porcentaje de indecisos entre las opciones, considerando que éstos se comportan igual que el resto de la población. Esto se hace para que no se reduzca la muestra, lo que eleva el error en esa pregunta.
Es muy engañoso que no se incluyan los indecisos y quienes prefieren ocultar su opinión (no sabe, no contesta), así como hacer proyecciones considerando sólo quienes respondieron. No es lo mismo que 400 de 1.000 personas que están a favor de algo (40%) que decir que 400 de 700 (57%), con 300 indecisos.