“Si un sitio web ha publicado noticias falsas antes, hay una buena posibilidad de que lo haga de nuevo”, afirma Ramy Baly, autor principal del estudio y postdoctorado en el MIT La meta es una defensa proactiva: identificar los focos de desinformación desde sus inicios, antes de que sus narrativas puedan distorsionar el debate público y, crucialmente, influir en el electorado. Este sistema de vanguardia sólo requiere alrededor de 150 artículos de una fuente para detectar de manera fiable su veracidad y sesgo político. Por ejemplo, los medios de noticias falsas suelen emplear un lenguaje más hiperbólico, subjetivo y emocional. El algoritmo también toma en cuenta la página de Wikipedia de un medio y la estructura de sus URL: los complejos y con caracteres especiales se asocian a fuentes menos fiables. El sistema ha demostrado una importante precisión del 65% en la detección de la veracidad (alta, baja o media) y aproximadamente un 70% en la detección del sesgo político (izquierda, derecha o moderado) de nuevas fuentes. El equipo ha democratizado esta herramienta, creando un conjunto de datos de código abierto con más de 1.000 fuentes de noticias, anotado con puntuaciones de veracidad y sesgo, siendo la base de datos más grande de su tipo a nivel mundial