Basat en tècniques d'intel·ligència artificial, el sistema analitza la notícia en dos nivells detectant si existeixen incongruències en el contingut i si l'estructura coincideix amb la que qual qualsevol publicació amb rigor periodístic ha de tindre.

Amb l'objectiu d'oferir una major confiança al lector i dotar als periodistes de noves ferramentes que li permeten destriar entre diverses informacions, els investigadors han publicat en la revista Expert Systems with Applications un article titulat 'Exploiting discourse structure of traditional digital media to enhance automatic fake news detection' en el qual presenten el prototip d'un detector de 'fake news' per a webs.

El sistema, segons s'ha informat des de la Fundación Descubre, analitza l'estructura de la notícia publicada atenent a les normes de periodisme clàssiques: la regla de les 5W+H, coneguda així per les sigles de les qüestions en anglés, i la piràmide invertida.

Segons aquestes guies, la notícia rigorosa ha de contindre informació que responga les sis preguntes bàsiques (què?, quan?, on?, qui?, per què? i com?) i s'ha d'estructurar en gradació des del més important fins als detalls.

"L'estructura d'una publicació ens dóna pistes de si hi ha base periodística o si, per contra, imita a una notícia real", ha indicat l'investigador de la Universitat de Jaén (UJA) Miguel Ángel García, autor de l'article.

A partir de l'anàlisi del llenguatge natural, els experts desenvolupen un algoritme que detecta les informacions que no responen aquesta estructura. Aquests càlculs es basen en tècniques d'aprenentatge automàtic, també conegut com 'machine learning', de manera que el sistema va aprenent a mesura que va acumulant dades.

A més, la màquina pot processar en segons milers de dades simultànies, alguna cosa que una persona no podria fer. La investigadora de la Universitat d'Alacant Estela Saquete, també autora de l'article, ha apuntat que amb aquest sistema, els periodistes poden contrastar fonts, detectar estructures incorrectes, viralitzades, o que tinguen incongruències entre el titular i el cos de manera immediata i automàtica. També l'usuari final pot tindre evidències de si la notícia que llig compleix amb uns estàndards o no.

Els equips 'Sistemas Inteligentes de Acceso a la información' (Sinai), de la Universitat de Jaén, i 'Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información'(Gplsi), de la Universitat d'Alacant, van realitzar les proves sobre un conjunt de dades en espanyol amb més de 200 articles centrats en temes sanitaris, d'especial rellevància en l'actualitat a causa de les nombroses notícies falses que circulen sobre covid-19.

El sistema pren com a base l'aprenentatge profund, amb el qual es creen models computacionals compostos per diverses capes de processament de dades. Concretament en aquest treball, els experts defineixen dos capes. D'una banda l'estructura de la notícia i de l'altra l'argument. D'aquesta manera, la màquina prediu no solament la credibilitat de la forma, sinó també del contingut.

A més, els investigadors han aplicat un nou esquema en el tractament de les dades, conegut com a anotació de gra fi, que consisteix a establir etiquetes a les notícies. Aquestes marques s'apliquen a totes les possibilitats, encara que les diferències siguen menudes. D'aquesta manera s'obté una descripció detallada en els dos nivells per a cada text.

Cada etiqueta té un conjunt d'atributs que proporcionen informació més enllà del lingüístic incloent la verificació de fets, relacions semàntiques entre components o característiques contextuals. Fins i tot, referencia aspectes relacionats amb la càrrega emocional que puga contindre un escrit i que ho allunyen de l'objectivitat que ha de tindre una notícia real.

L'objectiu dels experts és aconseguir una aplicació que marque automàticament el text d'una notícia mentre es llig i que alerte mitjançant un senyal de parts de la notícia que puguen ser falses, indicant la referència amb altres textos similars en els quals es puga contrastar la seua veracitat.

Aquesta investigació s'ha desenvolupat mitjançant els projectes 'Living-LANG: Modelado del comportamiento de entidades digitales mediante Tecnologías del Lenguaje Humano', del Ministeri de Ciència i Innovació i 'SIIA: Tecnologies del llenguatge humà per a una societat inclusiva, igualitària, i accessible' de la Comunitat Valenciana.