Comment les détecteurs des fausses informations peuvent-être contournés

Cependant, les approches récentes ont pris en compte d'autres signaux, tels que les fonctionnalités du réseau et les engagements des utilisateurs, en plus du contenu de l'histoire pour augmenter leur précision.

Détecteurs de fausses nouvelles manipulés via les commentaires des utilisateurs

Cependant, une nouvelle recherche menée par une équipe du Collège des sciences et technologies de l'information de Penn State montre comment ces détecteurs de fausses nouvelles peuvent être manipulés via les commentaires des utilisateurs pour marquer les vraies nouvelles comme fausses et les fausses comme vraies. Cette approche d'attaque pourrait donner aux adversaires la possibilité d'influencer l'évaluation du détecteur de l'histoire même s'ils ne sont pas l'auteur original de l'histoire.

«Notre modèle n'exige pas que les adversaires modifient le titre ou le contenu de l'article cible», a expliqué Thai Le , auteur principal de l'article et doctorant au College of IST . "Au lieu de cela, les adversaires peuvent facilement utiliser des comptes aléatoires sur les réseaux sociaux pour publier des commentaires malveillants afin de rétrograder une histoire réelle en tant que fausse nouvelle ou de promouvoir une fausse histoire comme de vraies nouvelles."

Autrement dit, au lieu de tromper le détecteur en attaquant le contenu ou la source de l'histoire, les commentateurs peuvent attaquer le détecteur lui-même.

Les chercheurs ont développé un cadre - appelé Malcom - pour générer, optimiser et ajouter des commentaires malveillants lisibles et pertinents pour l'article dans le but de tromper le détecteur.

Ensuite, ils ont évalué la qualité des commentaires générés artificiellement en voyant si les humains pouvaient les différencier de ceux générés par de vrais utilisateurs. Enfin, ils ont testé les performances de Malcom sur plusieurs détecteurs de fausses nouvelles populaires.

Malcom a obtenu de meilleurs résultats que la référence pour les modèles existants en trompant cinq des principaux détecteurs de fausses nouvelles basés sur les réseaux neuronaux plus de 93% du temps. À la connaissance des chercheurs, il s'agit du premier modèle à attaquer les détecteurs de fausses nouvelles en utilisant cette méthode.

Les avantages

Cette approche peut être attrayante pour les attaquants car ils n'ont pas besoin de suivre les étapes traditionnelles de diffusion de fausses nouvelles, qui consistent principalement à posséder le contenu.

Les chercheurs espèrent que leurs travaux aideront les personnes chargées de créer des détecteurs de fausses nouvelles à développer des modèles plus robustes et à renforcer les méthodes de détection et de filtrage des commentaires malveillants, aidant finalement les lecteurs à obtenir des informations précises pour prendre des décisions éclairées.

«Les fausses nouvelles ont été promues avec l'intention délibérée d'élargir les divisions politiques, de saper la confiance des citoyens dans les personnalités publiques, et même de créer de la confusion et des doutes parmi les communautés», a écrit l'équipe dans son article.

Ajouté Le, «Notre recherche montre que les attaquants peuvent exploiter cette dépendance à l'engagement des utilisateurs pour tromper les modèles de détection en publiant des commentaires malveillants sur des articles en ligne, et cela souligne l'importance de disposer de modèles de détection de fausses nouvelles robustes capables de se défendre contre les attaques adverses.»

 
 


Rejoindre la conversation