El Gobierno detecta 450.000 mensajes de odio en 6 meses con la nueva herramienta que utiliza IA

El Sistema FARO se implantó en marzo para identificar y analizar los contenidos, además de evaluar la respuesta de las plataformas digitales contra ellos

25/09/25 | 13:00 | Tiempo de lectura: 5 min.

Etiquetas:

Una herramienta pionera contra la intolerancia
Cómo funciona el proceso
Qué mensajes se detectan con más frecuencia
Balance y perspectivas

El Gobierno ha detectado en apenas seis meses cerca de 450.000 mensajes de odio en redes sociales, gracias a la puesta en marcha del Sistema FARO, una innovadora herramienta de rastreo basada en inteligencia artificial que entró en funcionamiento el pasado mes de marzo.

Esta tecnología, desarrollada conjuntamente por el Observatorio Español de Racismo y Xenofobia (OBERAXE), el Ministerio de Inclusión, Seguridad Social y Migraciones y LaLiga, permite identificar, analizar y reportar en tiempo real los contenidos discriminatorios en las principales plataformas digitales, al tiempo que evalúa la eficacia de su respuesta frente a los discursos intolerantes.

Los datos revelados por OBERAXE muestran que, de enero a agosto de 2025, el sistema ha logrado detectar 614.833 contenidos reportables, con un pico especialmente significativo en julio, cuando se contabilizaron 190.000 mensajes de odio.

En agosto, aunque el volumen fue menor —69.464 contenidos de carácter racista—, las cifras se mantienen muy por encima de las registradas en la primera mitad del año, lo que confirma la tendencia creciente.

Una herramienta pionera contra la intolerancia

El Sistema FARO (Filtrado y Análisis de Odio en las Redes Sociales) nació con el objetivo de fortalecer la lucha contra la intolerancia en el entorno digital, centrándose en discursos racistas, xenófobos, islamófobos, antisemitas y antigitanos.

Para ello combina dos tecnologías complementarias: Monitor FARO, desarrollado por Séntisis Intelligence, y ALERTODIO.

Esta sinergia permite no solo detectar y clasificar mensajes, sino también reportarlos directamente a las plataformas y comprobar si éstas reaccionan eliminando el contenido o limitando su visibilidad.

El sistema se conecta a las API oficiales de Facebook, Instagram, TikTok, YouTube y X (antes Twitter), rastreando en tiempo real posibles mensajes de odio. Posteriormente, se aplica un doble filtro: primero una clasificación automatizada con IA basada en más de 100.000 reglas semánticas en español, y después una revisión manual por parte del equipo de OBERAXE.

Este modelo garantiza una mayor precisión y, además, permite entrenar a la inteligencia artificial para adaptarse a nuevas formas de discurso discriminatorio.

Cómo funciona el proceso

El trabajo del sistema se estructura en cuatro fases: captación, filtrado, análisis y reporte. En la primera etapa, el monitor rastrea el contenido publicado en redes y distingue entre discurso de odio ilegal o contrario a las normas de la plataforma, y narrativas discriminatorias que, sin ser delictivas, fomentan la intolerancia.

Una vez analizados los mensajes, aquellos que cumplen con los criterios son reportados. FARO también evalúa el tiempo de respuesta de las plataformas —si eliminan el contenido en 24 horas, 48 horas o una semana— y distingue los casos que requieren un reporte prioritario a través de Trusted Flaggers. Cuando el mensaje constituye un delito de odio grave, se traslada directamente a la Fiscalía de Delitos de Odio y Discriminación.

La ministra de Inclusión, Seguridad Social y Migraciones, Elma Saiz, y el presidente de LaLiga, Javier Tebas, durante la presentación del balance de 'Este partido lo vamos a ganar', la campaña contra el racismo, en la sede de LaLiga. (Foto: Alberto Ortega / Europa Press)

Qué mensajes se detectan con más frecuencia

El sistema no solo contabiliza los mensajes, sino que también los clasifica en función de varios parámetros: el grupo diana de los ataques, el episodio que origina el discurso, la tipología del contenido, la forma de expresión del lenguaje y el género de las personas contra las que se dirige.

Según los datos de agosto, el colectivo más atacado sigue siendo el de personas originarias del norte de África, que concentró el 77% de los mensajes detectados, una cifra inferior al 91% de julio, mes en el que los incidentes ocurridos en Torre Pacheco dispararon el volumen de publicaciones racistas.

En agosto, el repunte estuvo asociado a una presunta agresión sexual en Ferrol que desencadenó una oleada de comentarios hostiles.

En cuanto a la tipología, casi la mitad de los mensajes (47%) correspondieron a contenidos que deshumanizan o degradan a estos colectivos. También destaca el incremento del uso de lenguaje explícitamente agresivo, que ha pasado del 70% en el primer trimestre al 88% en julio y hasta el 94% en agosto, lo que confirma una escalada preocupante en la forma de expresarse del discurso de odio en redes.

Balance y perspectivas

Los responsables de OBERAXE destacan que la implantación del Sistema FARO ha permitido dar un salto cualitativo en la lucha contra el odio online, al ofrecer datos precisos, clasificaciones detalladas y un seguimiento de la eficacia de las plataformas digitales frente a este tipo de contenidos.

Pese a ello, advierten de que las cifras registradas reflejan una realidad alarmante: el discurso de odio, especialmente el racista y xenófobo, sigue muy presente en la esfera digital española y se intensifica en momentos de tensión social o tras determinados sucesos.

El Gobierno y las entidades implicadas recalcan que el objetivo no es únicamente detectar y retirar mensajes, sino también comprender las dinámicas que los generan para anticiparse a su propagación.