Articles

Publié le 19 janvier 2020 Mis à jour le 19 janvier 2020

Forces et faiblesses de l’intelligence artificielle dans la lutte contre la désinformation

Pourquoi l’IA ne peut-elle pas permettre une détection parfaite ou à 100% des fausses nouvelles?

Les fausses nouvelles ou infox, sont devenus un véritable casse-tête pour tout le monde, du politicien[1] au sociologue, de l’informaticien à l’enseignant. Internet aujourd’hui a beaucoup bouleversé les dynamiques communicationnelles en permettant aux citoyens de produire et diffuser eux même de l’information[2]. D’où la difficulté de distinguer le vrai de l’ivraie dans ce magma informationnel et l’émergence de sites de vérification des faits comme Snopes.com et PolitiFact, qui emploient des chercheurs et des écrivains pour démystifier les mensonges sur l'Internet.

Par exemple, des chercheurs de Snopes parcourent Internet pour recueillir autant d'informations contextuelles qu'ils le peuvent, quand les événements de l'histoire se seraient produits, qui était impliqué etc. Ils recherchent également les sources originales et essaient d'appeler ou d'envoyer un courriel à la personne qui a publié la première version d’un article. Après avoir reçu toute cette information, ils prennent une décision. Le processus peut se dérouler rapidement ou prendre des jours.

En contexte

Bien que cela puisse être efficace dans une mesure ou une autre, ne serait-il pas mieux de pouvoir automatiser ce travail de vérification et permettre à l’intelligence artificielle de pouvoir directement nous indiquer la crédibilité, fiabilité et qualité d’une information ? Ilya Sutskever, directeur de recherche pour OpenAI, a indiqué qu'une IA vérifiant les faits pourrait être conçue pour s'attaquer au travail de la même manière que les humains le font maintenant : 

« Une approche possible serait d'avoir un système qui aurait une compréhension sophistiquée et détaillée de la signification du texte - ce qui n'est pas encore possible aujourd'hui - puis de lire de nombreux articles différents provenant de nombreuses sources d'information différentes et de chercher des incohérences, tout comme un humain dont le travail à plein temps est de déterminer si quelque chose est faux ou non »

Évidemment, cela semble plus facile à dire qu’à faire et certains facteurs limitent ou empêchent les intelligences artificielles d’être parfaitement efficace dans la détection des infox. Nous expliquerons nos raisons et présenterons quelques projets s’appuyant sur l’IA qui sont néanmoins efficaces.

  1. Le caractère humain de la pensée critique.

S’il est aisé pour l’IA d’identifier et retracer la source d’une information par le biais de centaines ou milliers de vérifications croisées (cross-checking), il est par ailleurs plus difficile d’apprécier « intelligemment » cette information sans pensée critique. Une compréhension holistique du monde et la capacité de comprendre des concepts ou non-dits, peuvent s’avérer déterminant pour déterminer la qualité d’une information.

Si Facebook et Google ont pu créer des algorithmes permettant de curer et personnaliser le contenu informationnel présenté à leurs milliards d’usagers, il leur est par ailleurs plus difficile de détecter la qualité (crédibilité, fiabilité) de cette information-là. Et de nombreux projets reposant sur l’IA ont échoué à cause de cette incapacité à penser critiquement.

  1. Le caractère « nouveau » de l’information

Le caractère nouveau de l’information publiée, implique que les données nécessaires pour en vérifier la factualité ou véracité, peuvent ne pas être encore en ligne.

« Il est incroyablement difficile de connaître l'état du monde pour savoir si un fait est vrai ou non », déclare Richard Socher, directeur de Salesforce Research.

« Même si nous avions un moyen parfait d'englober et d'encoder toutes les connaissances du monde, l'intérêt des nouvelles, c'est justement l’apport de quelque chose de ‘nouveau’ au champ de la connaissance. »

Un petit site d’information peut publier quelque chose de vrai, or l’IA peut considérer cela comme étant ‘faux’ tout simplement parce qu’il n’existe aucune autre référence existante en ligne. Pour repérer une fausse source d'information en temps quasi réel, des chercheurs du MIT et du Qatar Computing Research Institute (QCRI) ont développé un système à l'aide de variables qui pouvaient être tabulées indépendamment des personnes chargées de vérifier les faits.

Il s'agissait notamment d'analyses du contenu, comme la structure des phrases des titres et la diversité des mots dans les articles ; des indicateurs globaux du site, comme la structure URL et le trafic sur le site Web ; et des mesures de l'influence du média, comme son engagement dans les médias sociaux et sa page Wikipedia, le cas échéant.

Pour sélectionner les variables, les chercheurs se sont appuyés à la fois sur des recherches antérieures – qui avaient démontré que les faux articles de nouvelles ont tendance à avoir des choix de mots répétitifs - et sur de nouvelles hypothèses.

  1. Comment donc parvenir à détecter les infox grâce à l’intelligence artificielle ?

Lorsque Mark Zuckerberg de Facebook, avait promis au Congrès que l'intelligence artificielle aiderait à résoudre le problème des fausses nouvelles, il n'avait pas révélé le comment. Cependant, de nouvelles recherches nous rapprochent un peu plus de ce résultat.

Des chercheurs du MIT, du Qatar Computing Research Institute (QCRI) et de l'Université de Sofia en Bulgarie ont testé plus de 900 variables possibles pour prévoir la fiabilité d'un média - probablement le plus grand ensemble jamais proposé. Ils ont ensuite formé un modèle d'apprentissage machine sur différentes combinaisons des variables afin de déterminer laquelle produirait les résultats les plus précis. Le meilleur modèle a étiqueté avec 65 % de précision les journaux télévisés avec une factualité "basse", "moyenne" ou "élevée".

L’IA appelé FiB, vérifie les articles publiés sur Facebook par rapport à ceux présents sur des sites Web réputés ; il parcoure également le site hébergeant l'article en question dans des bases de données de sites Web connus pour les logiciels malveillants ou le phishing. Le logiciel est gratuit sur le Chrome Web Store pour votre navigateur et aussi open-source, de sorte que les développeurs peuvent le bricoler eux-mêmes.

Fake News Alert est un autre exemple de logiciel développé par Brian Feldman du New York Magazine, qui vise à limiter le problème de fausses nouvelles de Facebook en vérifiant simplement si un site figure sur une liste conservée de faux sites de nouvelles. Si le logiciel est installé sur votre ordinateur (également disponible sous la forme d'une extension de navigateur Google Chrome), une alerte s'affiche lorsque vous cliquez sur un lien qui vous dirige vers un site de la liste.

Ce genre d'approche permet de limiter les fausses nouvelles provenant de l'extérieur des médias grand public. Mais, il arrive parfois que les grandes chaînes d'information comme CNN et la BBC se lancent dans une histoire qui est à la mode, mais pas nécessairement vraie… Ils n’ont donc pas le monopole de la vérité ou crédibilité.

Vers la création d’un algorithme humain ?

Au regard des raisons sus-évoquées, il est difficile de trouver une intelligence artificielle détectant à 100% les infox. Chacun des exemples présentés ont leurs forces et faiblesses. Or le ‘problème’ avec les infox c’est qu’ils peuvent facilement et rapidement déstabiliser un pays ou situation.

Avec l’accès universel à internet, un taux d’erreur même de 1% dans la détection des infox est assez considérable, car cela peut induire en erreur des millions de personnes. La poule aux œufs d’or serait de trouver un algorithme capable de raisonner comme un humain et possédant une pensée critique.

Les humains ont toujours été meilleurs en matière de vérification des faits. En définitive, Carolyn Ryan, rédactrice en chef de la rubrique politique du New York Times, estime que l'interrogation rigoureuse des sources d’informations avant leur publication est la fonction première de toute presse ou média professionnel cherchant à gagner la confiance du public.

Seule une bonne éducation et sensibilisation sur les meilleures pratiques de communication et d’utilisation des médias. Nous n’arrêterons certainement ni complètement pas les infox, mais nous pouvons les contrôler et gérer.


Notes et références

[1] Pierre Lévy, ‘Le rôle des humanités numériques dans le nouvel espace politique’, Sens Public, 21 Janvier 2019
http://sens-public.org/articles/1369/

[2] Legros Virginie Guignard, ‘Fausses nouvelles et innovations : effets et solutions’, Thot Cursus, https://cursus.edu/12511/fausses-nouvelles-et-innovations-effets-et-solutions


Voir plus d'articles de cet auteur

Dossiers

  • Cursus - Intelligence Artificielle


Le fil RSS de Thot Cursus - Besoin d'un lecteur RSS ? Feedly, NewsBlur


Les tweets de @Thot


Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez nos infolettres en pédagogie et technologies éducatives

Vous pourrez aussi indexer vos ressources préférées et retrouver votre historique de consultation

M’abonner à l'infolettre

Superprof : la plateforme pour trouver les meilleurs professeurs particuliers en France (mais aussi en Belgique et en Suisse)


 

Ajouter à mes listes de lecture


Créer une liste de lecture

Recevez nos nouvelles par courriel

Chaque jour, restez informé sur l’apprentissage numérique sous toutes ses formes. Des idées et des ressources intéressantes. Profitez-en, c’est gratuit !