Pasar al contenido principal
Viernes, 21 Junio 2024

¿Qué significa que Meta entrene su IA con mis datos y cómo puedo oponerme desde Latinoamérica?

Por Jhoandry Suárez

La tecnológica anunció que usará la información de sus redes sociales en su inteligencia artificial. Aquí explicamos qué se sabe, qué no y cómo protegerse.

3 DATOS CLAVE:

  1. Meta informó que empezará a utilizar datos de los usuarios de sus redes sociales, como Facebook, para entrenar su inteligencia artificial. Aunque en parte ya lo venía haciendo desde 2018 para mejorar el algoritmo de Instagram.
  2. La empresa habilitó un formulario para objetar, pero solo en la Unión Europea y Reino Unido. Se ha difundido información sin esta aclaración y algunas personas han creído que postear un mensaje en sus cuentas les exime de la medida.
  3. El formulario no existe en Latinoamérica por diferencias de regulación y no garantiza que se excluyan los datos de una persona, pues Meta puede rechazar la objeción. Mucho menos sirven las publicaciones en las mismas redes, pero sí te explicamos otras opciones para limitar un poco el acceso a tu información en este caso (aunque otros gigantes tecnológicos ya tienen políticas similares).

A partir del 26 de junio de 2024, la empresa tecnológica Meta, propietaria de las redes sociales Facebook e Instagram y la plataforma de mensajería WhatsApp, comenzará a entrenar su modelo de inteligencia artificial (IA) con los datos de los usuarios de sus productos, según reveló el mes pasado en una decisión que levantó una polémica alrededor de su manejo de la información y la privacidad.

La compañía especificó que, con ese propósito, utilizará toda información disponible allí: publicaciones, fotos, videos, textos, comentarios, incluso datos personales, con excepción de los mensajes privados, según un portavoz de la corporación. Pese a esto último, las conversaciones con el chatbot del conglomerado sí serán parte de los recursos de los que echará mano el programa.

Ni siquiera están exentas de afectación por la medida aquellas personas que no sean parte de las redes sociales de Meta. La tecnológica podrá usar la información suya que aparezca en las publicaciones de algún usuario que sí esté. 

En medio de este panorama, recibimos la solicitud de verificar un hilo de X, con más de 1,8 millones de vistas, de la escritora española Yolanda Casares Alcalá (@yolanda_casares). Su cadena de mensajes señala que, con esta medida, la empresa podrá “hacer imágenes a través de Inteligencia Artificial con tu cara o la de tus niños y vendérsela a los anunciantes” (sic).

“¿Qué puede pasar con esto? Pues que la foto de tu bebé en la guarde que con tan buena intención hizo su seño aparezca en un anuncio de pañales, las del cole vete tu a saber dónde” (sic), afirmó y, enseguida, explicó cómo los usuarios pueden oponerse a tal medida a través de un formulario. No obstante, en las respuestas hay quejas sobre problemas para rellenar la planilla o que no les aparece a algunas personas.

En Colombiacheck, ante la petición recibida, elaboramos este explicador para exponer las desinformaciones en torno a este tema, describir en qué consiste la reciente decisión de Meta, qué implicaciones tiene, cómo oponerse (una opción que solo tienen en Europa) y qué medidas tomar desde América Latina para limitar el acceso de la información por parte del gigante tecnológico.

Cabe resaltar que los planes de Meta fueron suspendidos justamente en el Viejo Continente, de acuerdo con un comunicado de la empresa. Esto se debió al rechazo de la Comisión Irlandesa de Protección de Datos (DPC), el principal regulador de las redes sociales en la Unión Europea, y a una solicitud de la Oficina del Comisionado de Información (ICO) del Reino Unido.

“No autorizo a Meta…”

Luego del anuncio de Meta, en redes sociales comenzó a circular información descontextualizada sobre cómo oponerse a la medida. Esto empezó porque la compañía habilitó un formulario solo para usuarios en parte de Europa para excluir sus datos personales de la alimentación de la IA de esta empresa, aunque la solicitud se sometería a revisión para su posible aprobación.

Medios de Latinoamérica y locales publicaron cómo rellenar la plantilla. Sin embargo, no aclararon que esta opción solo estaba disponible para territorio europeo (1, 2, 3, 4).

Por otro lado, influenciadores de ese lado del mundo hablaron de esta medida y le recomendaron a los usuarios usar el siguiente texto a la hora de rellenar su solicitud:

“No doy mi consentimiento para que Meta use las imágenes, vídeos, audios o cualquier contenido multimedia subido por mí a ninguna de las plataformas que formen parte del grupo empresarial Meta (Facebook,  Instagram, Whatsapp y cualquier otra red social que pueda fundar o compra en el futuro) para ningún uso relacionado con la Inteligencia Artificial” (1, 2, 3).

Ese mismo mensaje fue difundido por la usuaria @yolanda_casares, a quien nos pidieron verificar.

influencer españoles

Sin embargo, perfiles en Facebook (incluso en Colombia) utilizaron el texto directamente en sus publicaciones, aunque en realidad esto no ayude a proteger sus datos, pues cualquier reparo al anuncio de Meta deber ser comunicado a través del formulario mencionado (1, 2, 3, 4, 5, 6).

publicaciones de Instagram

También encontramos otras variantes del mismo mensaje pero que inician con “no autorizo a Meta a…” (1, 2, 3).

post de Facebook e Instagram

Recordemos que en España, Argentina y Colombia ha circulado desde 2021 una cadena falsa que también empieza con “No autorizo” y supuestamente es para prohibir el uso de mensajes, fotos, archivos, etc. almacenados en WhatsApp por parte de Meta (1, 2, 3).

¿Qué datos recolectará Meta?

Meta apunta que, para capacitar su modelo de inteligencia artificial, necesita de gran cantidad de datos, los cuales obtiene de “información que está disponible públicamente en línea y con licencia”, así como de la “información compartida sobre los productos y servicios de Meta”.

La empresa especifica que puede utilizar publicaciones, fotografías o sus títulos en sus redes. En caso de que recopile información pública de Internet, puede incluir datos personales; por ejemplo, si extrae una publicación de blog pública, puede tomar de allí el nombre del autor y la información de contacto.

Lo único que no se usaría para el entrenamiento serían mensajes privados de las personas con sus contactos, como amigos y familiares, según dijo un portavoz de la compañía. No obstante, las conversaciones con su chatbot no hacen parte de esa excepción y, por tanto, sí entrarían al programa.

Cabe recordar que la misma compañía, en la más reciente actualización de sus políticas de privacidad (diciembre de 2023), advierte sobre una cantidad de datos que recolecta cuando se utilizan sus productos:

datos que recolecta Meta

Fuente: Política de Privacidad de Meta.

Además, al menos desde 2018, se sabe que Meta está usando las fotos de Instagram para entrenar su IA de reconocimiento de imágenes. La prueba más grande de la compañía en ese momento utilizó más de 3.500 millones de imágenes etiquetadas con 17.000 ‘hashtags’. 

El año pasado, un artículo de Reuters reveló que Meta había usado publicaciones de Facebook e Instagram para entrenar partes de su inteligencia artificial y solo excluyó aquellas marcadas como privadas, al igual que los mensajes. El portal de tecnología ARS Technica expuso, además, que para capacitar el generador de imágenes del conglomerado se emplearon 1.100 millones de fotos de sus redes sociales. 

Si no uso los productos de Meta, ¿también pueden usar mis datos?

A pesar de que alguien no use sus productos o servicios, Meta señala que puede procesar información sobre esa persona para mejorar su IA. Esto podría ocurrir en caso de que la información sobre ella haya sido compartida en las redes sociales por alguien más, por ejemplo, en una imagen.

¿Es legal que Meta recolecte estos datos?

Los términos legales de Facebook especifican que “si compartes una foto en Facebook, nos concedes permiso para almacenarla, copiarla y compartirla con otros”. Además, dependiendo de tu configuración, esa foto puede ser utilizada para otros productos de Meta (tal como el caso mencionado de 2018). 

En Europa, aunque los usuarios pueden usar la función de exclusión voluntaria de sus datos para alimentar la IA de Meta, igual persisten preocupaciones sobre el manejo de esta información. 

“Meta no dice para qué utilizará los datos, por lo que podría tratarse de un simple chatbot, de publicidad personalizada extremadamente agresiva o incluso de un dron asesino”, señaló Max Schrems, presidente y fundador del Centro Europeo de Derechos Digitales, conocido como NOYB (None of Your Business, que traduce “no es asunto tuyo” en inglés).

“El Tribunal de Justicia Europeo ya ha dejado claro que Meta no tiene un ‘interés legítimo’ que anule el derecho de los usuarios a la protección de datos cuando se trata de publicidad. Sin embargo, la empresa está tratando de utilizar los mismos argumentos para el entrenamiento de la indefinida ‘tecnología de IA’”, agregó. 

A propósito, Valentina Ortega, investigadora de Linterna Verde, una organización no gubernamental dedicada a temas de debate público y espacios digitales, explica la importancia de este punto sobre el interés legítimo:

“Meta está llevando a cabo esta operación amparándose en el Reglamento General de Protección de Datos (RGPD) de la Unión Europea, el cual permite la recolección de datos si se fundamenta en un interés legítimo del responsable del tratamiento. En otras palabras, utilizan las leyes de protección de datos como justificación; las mismas regulaciones que, en teoría, deberían ‘protegernos’”.

Pilar Sáenz, coordinadora del laboratorio de seguridad digital K+LAB de la Fundación Karisma, también aclaró que Meta tiene dos sedes. Una queda en Irlanda para sus usuarios en Europa, por ello cumple con legislaciones de la Unión Europea (UE). La otra es en California, Estados Unidos; cobija al resto del mundo y se rige por otras leyes que no son igual de estrictas.

Anteriormente a Meta se le había prohibido en Europa el procesamiento de datos personales de sus usuarios para servirles publicidad ajustada a su perfil, de acuerdo con una decisión de la Junta Europea de Protección de Datos, el organismo que coordina las agencias de protección de datos de 27 países europeos. 

¿En Latinoamérica existe alguna legislación al respecto?

Sáenz aclaró que en Latinoamérica no hay regulaciones que protejan del tratamiento de datos que hace Meta, porque no existen a nivel regional y cada país va creando sus propias leyes. “Existen algunas, conocidas como leyes blandas, porque hay disposiciones de la Corte Interamericana de Derechos Humanos o las relatorías de libertad de expresión de algunas instancias”, apuntó. 

La investigadora de Karisma agregó que en Colombia existían seis proyectos de ley relacionados con la IA hasta el pasado 20 de junio, cuando terminó la más reciente legislatura. El estatutario 200 de 2023, que buscaba una regulación en el marco de los derechos humanos y se tramitaba en la Cámara liderado por los representantes Karyme Cotes (liberal por Sucre) y Alirio Uribe (del Polo, dentro del Pacto Histórico, por Bogotá), terminó archivado por falta de tiempo. 

No obstante, Ortega, de Linterna Verde, señala que en el país existe la Ley Estatutaria de Protección de Datos (Ley 1581 de 2012), que incluye un artículo que podría ser utilizado por Meta para llevar a cabo la recolección. Se trata del 6, literal b, que autoriza el tratamiento de información sensible si es para salvaguardar el “interés vital” del titular y no aclara específicamente a qué se refiere con este término.

¿Qué IA está desarrollando Meta?

La compañía se encuentra desarrollando experiencias de IA generativa (capaz de producir texto, imágenes u otros contenidos) como Meta AI y AI Creative Tools, así como una plataforma abierta para apoyar a investigadores, desarrolladores y otros miembros de la comunidad.

La primera es un asistente lanzado en 2023 con el que los usuarios pueden hablar como si fuera una persona en WhatsApp, Facebook Messenger o Instagram. Esta tecnología se apoya en su modelo de lenguaje extenso (LLM, por su siglas en inglés), denominado Llama, cuya versión 3 fue presentada este año como una respuesta a ChatGPT de OpenAI y a Gemini de Google, con la diferencia de que es gratuito para que casi cualquier persona lo utilice con fines comerciales y de investigación.

Ortega, de Linterna Verde, indicó que, si bien el manejo de estos datos para entrenar sistemas de IA puede parecer una novedad, en realidad, los algoritmos han estado empleando datos desde el principio.  

“Meta, al hacer explícito su uso de datos para IA, pone de manifiesto una realidad que siempre ha existido: lo que publicamos en redes sociales, incluidas nuestras fotos, puede ser utilizado para estos fines”, sostuvo y advirtió que, aunque hoy en día se hable del anuncio de la compañía, en realidad muchas otras plataformas hacen lo mismo. 

¿La IA podría generar una imagen mía?

Una de las afirmaciones más alarmantes en la publicación de la escritora Casares que nos pidieron verificar es que la IA de Meta pueda usar la foto de un bebé subida a las plataformas de la empresa para generar, por ejemplo, un anuncio de pañales. Ante esto, no se tiene una respuesta confiable.

Lo que se sabe es que la compañía pretende, con su modelo generativo, crear imágenes originales luego de entrenar sus sistemas con millones de fotos en sus redes. “El modelo aprende la asociación entre estas descripciones de texto y las imágenes. Una vez que aprende la asociación, puede crear nuevas imágenes, como cuando una persona ingresa una descripción de texto de la imagen que desea generar”, señala la empresa.

En este sentido, Borja Adsuara, abogado experto en derecho digital en entrevista con el portal Público, señaló que las inteligencias artificiales generativas “producen contenidos inspirados o basados en otros, pero no los replican tal cual”. Así que, en teoría, su objetivo no es reproducir de forma idéntica las referencias de las que se nutrió, como la de un bebé en específico.

No obstante, una investigación liderada por Google y su filial de desarrollo de IA, DeepMind, habría mostrado lo contrario: que aplicaciones de generación de imágenes como DALL-E 2 de Open AI, Imagen de Vertex AI, una plataforma del mismo Google para desarrolladores basada en Gemini, y Stable Diffusion de Runway sí replican copias exactas de las fotos que usadas para su entrenamiento. Una versión preliminar del artículo científico correspondiente, que está pendiente de revisión por pares científicos, se titula “Extracting Training Data from Diffusion Models”.

¿Cómo oponerse al plan de Meta? El famoso formulario

Como se mencionó, Meta dispuso de un formulario tanto en Facebook como en Instagram para que los usuarios rechacen el manejo de sus datos para la capacitación de su IA. Sin embargo, este solo está disponible para la Unión Europea y Reino Unido. 

imagen de formulario

Pantallazo del formulario de objeción de Meta. Fuente: Maldita.es.

Esto se debe al Reglamento General de Protección de Datos (GDPR) que rige en el territorio europeo, por lo que legalmente la empresa está obligada a ofrecer a los usuarios alguna forma de objetar que sus datos participen en el programa. 

La investigadora Ortega aclaró que la misma Meta ha dicho que en otras partes del mundo donde lleguen a estar disponibles sus modelos, estos procedimientos se regirán por las leyes locales de protección de datos. Esta condición quiere decir que no siempre se va a habilitar un formulario similar.

Además, aunque un usuario solicite que se le excluya del programa, la compañía señala que revisará la petición “de acuerdo con las leyes de protección de datos pertinentes" y “si se acepta su solicitud, se aplicará en el futuro”. Es decir, rellenar este formulario no significa la revocatoria automática para el uso de datos (1, 2, 3), pues la compañía aún puede darle una negativa a la petición.

Igualmente, usuarios europeos expresaron sus quejas porque no era fácil acceder a esa planilla, demoras en el proceso y en la aplicación de la exención. 

Entonces, ¿qué opciones tengo para negarme si estoy en Latinoamérica?

Aunque Meta no ha dispuesto de una opción de formulario fuera de la Unión Europea y Reino Unido, existen algunas alternativas para negarle el acceso a información personal que esté disponible públicamente en internet o sobre nuestra actividad en otras páginas, la cual también usa para alimentar su inteligencia artificial.

  • Vía el Centro de ayuda de Facebook 

La página de Facebook tiene una página llamada “Derechos del interesado sobre la información de terceros utilizada para la IA en Meta”. En ella, los usuarios pueden enviar solicitudes relacionadas con su información personal de terceros que se utilizan para desarrollar y mejorar la IA de Meta.

Esta información puede incluir su nombre, dirección de domicilio, número de teléfono o dirección de correo electrónico que esté en Internet, así como la información bajo licencia sobre la cual otra persona tiene los derechos y le da permiso a Meta para usar.

formulario de datos de terceros

En el formulario existe la opción de eliminar cualquier información personal de terceros utilizada para crear y mejorar la IA en Meta. También la posibilidad de corregir esos datos o de hacer alguna consulta relacionada. 

Aquí es importante considerar que el formulario exige una descripción, y hasta un pantallazo de alguna respuesta dada por la IA de Meta en la que el usuario haya conseguido información suya. 

formulario de información de terceros
  •  Actividad fuera de Meta 

Meta también recopila información que empresas y organizaciones le envían sobre los usuarios cuando tienen interacciones en sus sitios web o utilizan su aplicación. Estos datos los usa la compañía para mostrarles a esos mismos usuarios publicaciones que podrían interesarles, relacionadas con eventos, productos o servicios. 

A través de la opción “Tu actividad fuera de las Metatecnologías”, en Facebook, se puede desconectar sitios web que comparten información con Meta, borrar la actividad anterior o administrar las actividades futuras.

Si se opta por desconectar o borrar la actividad, los datos recopilados por la compañía se eliminan. Al seleccionar la opción de "administrar actividades futuras", se revoca el acceso de Meta a futuros datos provenientes de terceros.

opciones de actividad fuera de Meta

También en Instagram se puede hacer lo mismo. Para ello, es necesario ir a "Configuración de la cuenta" y, luego, a "Su información y permisos". Aquí verá la opción "Su actividad fuera de las metatecnologías", en la cual tendrá las opciones mencionadas.

actividad fuera de Meta en Instagram

Meta pausó su plan en Europa 

El viernes 14 de junio, la empresa informó sobre la suspensión del entrenamiento de su inteligencia artificial con datos de usuarios de la Unión Europea y Reino Unido. Una medida que ocurrió tras una solicitud del principal regulador de las redes sociales en ese bloque de países.

“La DPC acoge con satisfacción la decisión de Meta de pausar sus planes para entrenar su modelo de lenguaje grande utilizando contenido público compartido por adultos en Facebook e Instagram en toda la UE”, dijo la comisión irlandesa en un comunicado

Meta, por su parte, expresó estar decepcionado. “Este es un paso atrás para la innovación europea, la competencia en el desarrollo de la IA y mayores retrasos para llevar los beneficios de la IA a los ciudadanos de Europa”, apuntó en su propio pronunciamiento de respuesta.

Cabe contextualizar que la organización NOYB había presentado 11 quejas ante los países de la UE bajo el argumento de que Meta estaba contraviniendo varios aspectos del Reglamento General de Protección de Datos. Argumentó que a los usuarios se les debía pedir permiso para usar su información en lugar de darles la opción de objetar. 

Google y OpenAI hacen lo mismo con los datos 

Meta no es el único gigante tecnológico con estas políticas.

Google cambió su política de privacidad en 2023, para utilizar todos los datos públicos para entrenar su IA generativa, Bard, su traductor y las funciones de IA de su servicio de la nube. Solo excluye aquella información marcada como privada o protegida por derechos de autor.

Esta compañía ni siquiera se limita a los datos recabados y hospedados en sus aplicaciones y sistemas. Por el contrario, recurre a toda la “información públicamente disponible online o a partir de otras fuentes públicas”.

Por otro lado, OpenAI explica que su ChatGPT es entrenado con información pública en Internet, bajo licencia de terceros y aquella que brindan sus usuarios o entrenadores humanos. No obstante, en su política de privacidad enumera otra serie de datos que también recopila de quienes lo utilizan:

  • Nombre.
  • Datos de contacto.
  • Credenciales de la cuenta.
  • Información de pago.
  • Historial de transacciones.
  • Historial de conversaciones.
  • Comentarios.
  • Archivos enviados o recibidos.
  • Dirección IP.
  • Tipo y configuración del navegador.
  • Fecha y hora de las solicitudes.
  • País de procedencia.
  • Historial de interacción con los servicios de OpenAI.
  • Funciones o recursos utilizados.
  • Sistema operativo.
  • Tipo de dispositivo.

Además, una investigación de The New York Times reveló la recopilación de datos de YouTube mediante la transcripción de los videos por parte de Google y OpenAI para entrenar sus modelos de inteligencia artificial. La plataforma Reddit recientemente también publicó que tiene un contrato por unos 200 millones de dólares en los próximos años a cambio de la concesión de licencias de sus datos a Google y OpenAI.