Ces journalistes entraînent des intelligences artificielles à démasquer la corruption (2)

LISEZ ICI LA PREMIÈRE PARTIE DE L’HISTOIRE

Mensonges répétés

Lors du premier débat entre Hillary Clinton et Donald Trump, la NPR a employé une équipe de 20 journalistes pour analyser et vérifier les faits en temps réel. Et si un ordinateur pouvait être à l’écoute de chaque mot prononcé par les politiciens, dans les médias, pour retracer la genèse et la diffusion de toutes leurs contre-vérités ? Full Fact, un organisme de fact-checking basé au Royaume-Uni, a récemment publié un rapport exhaustif indiquant que même si la vérification des faits entièrement automatisée n’est pas encore d’actualité, le fact-checking assisté par ordinateur est déjà là – c’est ce que Full Fact propose. « La plupart des gens sous-estiment ou surestiment ce qu’il est possible de faire », affirme Will Moy, directeur de Full Fact. « Certaines personnes pensent qu’il s’agit d’une technologie compliquée qu’on ne peut pas encore utiliser pour l’instant, d’autres pensent que nous allons enfin bénéficier de l’intelligence artificielle et que toutes ses promesses vont s’accomplir, ce qui n’est encore jamais arrivé. » Moy considère la vérification des faits comme un processus en quatre étapes, chacune pouvant être automatisée : surveiller les médias à travers une grande variété de sources ; identifier les déclarations potentiellement fallacieuses ; vérifier si elles le sont ; et publier les conclusions. Depuis le début de l’année, Full Fact a lancé en version bêta un système de surveillance qui analyse automatiquement à la fois les comptes-rendus des sessions parlementaires et les articles tirés d’une dizaine de sites d’informations, pour la plupart britanniques, de la BBC au Guardian en passant par le média conservateur américain réputé pour ses malversations de l’info Breitbart. Son but est de capter le cycle de vie de chaque mensonge : les observer faire surface, se propager et, si possible, disparaître grâce aux efforts de Full Fact. En observant cet écosystème, l’organisation espère peaufiner sa stratégie. « Notre démarche est unique par rapport à celle des autres organismes de fact-checking, car nous contactons les personnes qui ont commis des erreurs et nous leur demandons de les corriger », dit Moy. « Nous avons par exemple contraint le Premier ministre à publier des corrections officielles dans le Hansard (le registre dans lequel sont retranscrits les débats parlementaires), des journaux à publier des corrections, etc. » La plateforme interne de Full Fact surveille en permanence, sur des sources en ligne, l’apparition d’éléments liés à des affaires déjà démystifiées, à l’aide de requêtes faites à la main. Un procédé simple mais efficace. La prochaine étape, qui validera la procédure, est la détection automatique et la vérification de fausses statistiques. « La falsification de statistiques est très souvent identifiable : “X est en hausse” en est un exemple classique », dit Moy. C’est le genre d’information qu’un ordinateur peut identifier, puis confronter à des données publiques.

Will Moy
Crédits : DR

Full Fact alimente une base de données des sources officielles pour les principales statistiques et travaille avec le gouvernement britannique pour s’assurer que leurs données sont bien exploitables par une machine. L’espoir est qu’un ordinateur sera bientôt en mesure de trouver de lui-même la source primaire d’une falsification statistique. Mais il existe toutes sortes de raisons pour lesquelles ne prendre en compte que les chiffres peut être trompeur. Moy évoque une hausse récente du nombre de mariages détectée en Suède. Il ne s’agissait pas d’une saison des amours particulièrement faste, mais de la modification par le gouvernement de certaines règles fiscales. Souvent, les façons de mesurer évoluent au fil du temps ou diffèrent d’une région à l’autre, ce qui rend les comparaisons directes difficiles. Les logiciels qui ne savent pas interpréter de tels indices en arriveront à des conclusions erronées. Obtenir ce genre d’analyse contextuelle est un défi pour les chercheurs en IA, mais ce n’est pas un problème majeur pour Full Fact car dans le cadre de leur procédure, l’ordinateur a un vérificateur humain. La machine affiche la phrase contestable en regard des données qui peuvent la réfuter, et c’est à ce moment-là que le vérificateur humain intervient. L’objectif ultime de Full Fact est de changer la forme du discours public. Mais pour ce faire, il doit savoir quelles fausses informations sont le plus souvent répétées, et mesurer l’effet de ces interventions. « Les falsifications n’ont d’importance que lorsqu’elles sont répétées souvent, car un mensonge doit être beaucoup répété pour se transformer en vérité », dit Moy. « Il sera intéressant d’identifier ces allégations au fur et à mesure qu’elles continuent de se propager et de façonner le débat – sans être forcément sur le devant de la scène, car c’est leur accumulation dans le temps qui compte vraiment. »

Construire un cyborg

Alors que les ordinateurs ont trouvé un créneau en produisant des articles automatisés à partir de données, les journalistes utilisent déjà des logiciels pour effectuer des montages à partir d’images d’archives. On y entre le script, il en ressort une vidéo.

3525142_3_15d3_les-deux-co-fondateurs-de-wibbitz-zohar-dayan_83a5632edacfba56f3f251f9efdb7d61

Yotam Cohen et Zohar Dayan, les cofondateurs

La startup israélienne Wibbitz s’est lancée avec l’idée de créer un « diffuseur personnel d’actus vidéo ». En 2013, elle a lancé une application qui extrait des articles de diverses sources d’information, élague le texte au bon format et lit le résultat avec une voix de synthèse, le tout accompagné par des images qu’elle a sélectionnées. Depuis, la société a ajouté des présentateurs avec des voix d’acteurs et s’est concentrée sur les moyens à apporter aux éditeurs pour les aider à produire rapidement leurs propres vidéos. « Ce que nous avons créé avec Wibbitz, c’est une technologie qui permet d’automatiser la majorité du processus de production », déclare son cofondateur et PDG Zohar Dayan. La majorité, pas l’intégralité. Wibbitz transforme les articles en montages vidéo. D’abord, il crée un script en utilisant des techniques de traitement du langage pour sélectionner les phrases clés. C’est-à-dire que l’ordinateur n’écrit absolument rien, il retouche simplement la version humaine à la bonne longueur.

Ensuite, il analyse le texte pour trouver des « entités », ce qui inclut les célébrités et les entreprises, mais aussi des choses comme les compétitions sportives ou les événements notables. Il assemble une vidéo en recherchant des images illustrant ces entités dans des banques d’images telles que Getty Images et Reuters, ou dans les propres archives du média. Ces référentiels, avec leurs images et vidéos soigneusement référencées, sont la source de données critique qui sous-tend l’intelligence du système. « Même les données publiques en libre accès peuvent se révéler extrêmement utiles. Si vous savez les recueillir et les analyser, vous pouvez faire des choses qui n’ont jamais été possibles avant. » La production de vidéos évolutives se situe directement dans l’ère du temps des médias digitaux. Wibbitz est l’une des quelques entreprises de production vidéo assistée par ordinateur qui vendent actuellement aux médias, l’autre grand acteur du secteur étant Wochit.

Dror Ginzberg et Ran Oz, les cofondateurs

« Je peux intégralement produire une vidéo de 35 à 40 secondes en sept à dix minutes » , dit Neal Coolong, rédacteur en chef des sites sportifs de la chaîne USA Today. Il supervise quatre personnes dont la tâche principale est de produire des vidéos avec Wibbitz, chacune en produisant six ou sept par jour. En moyenne, ils ajoutent une vidéo dans près d’un article sur dix. Ces vidéos muettes sont conçues pour le visionnage sur téléphones mobiles ou sur réseaux sociaux, les sous-titres remplaçant la voix. Pourtant, la valeur de Wibbitz réside davantage dans son processus de travail que dans une IA sophistiquée. Coolong préfère écrire les scripts vidéo lui-même à l’aide de la fonctionnalité de résumé automatique et constate que l’ordinateur ne choisit pas toujours les meilleures illustrations. « Je veux que ce soit fait à ma façon », dit Coolong, en notant que Wibbitz obtient ses meilleurs résultats dans l’écriture d’articles traditionnels, alors que son équipe rédige la plupart du temps des articles d’opinion. Pour avoir une idée du niveau d’intelligence de Wibbitz, j’ai demandé à Dayan de me faire une démonstration du système en commençant par un article récent au sujet des hausses de prix d’EpiPen, l’adrénaline auto-injectable. Il a copié cinq paragraphes de l’article à partir duquel le système a généré une vidéo de 94 secondes en quelques instants. Elle était constituée de photos identiques du directeur de Mylan, le fabricant d’EpiPen, pour la plupart tirées du même entretien, plus une image du bâtiment du Capitole pour accompagner l’évocation du Congrès. Nous avons pu inclure des photos du produit lui-même en recherchant « EpiPen » dans l’interface d’édition.

Les géants de l’IA ont jusqu’à présent ignoré les journalistes.

Dayan assure que Wibbitz fonctionne mieux quand l’article traite d’une personnalité et d’actualités, ce qui suggère que les hausses de prix EpiPen sont quelque peu accessoires. Mais il note que le système s’améliore à chaque utilisation. Pendant les Jeux olympiques, il a fait des progrès considérables au sujet d’athlètes auparavant inconnus, au fur et à mesure qu’ils étaient mentionnés dans les articles traités par la plateforme. Savoir que Conor Dwyer est un nageur américain dans le 200 m nage libre masculin permet à l’ordinateur de présenter des photos de natation, même si le script n’indique jamais le mot « natation ». « Plus le contenu passe dans le système, plus le système devient intelligent et plus il apprend à faire le lien entre certains types d’éléments », explique Dayan. On note encore une fois l’importance de la profusion de données pour faire évoluer l’ordinateur. Coolong pense que le nombre de vidéos générées automatiquement ne vont faire qu’augmenter, mais qu’elles ne remplaceront pas la production vidéo traditionnelle à USA Today. « Nous n’avons pas d’équipe de télévision qui attend après les dernières actualités », note-t-il. Lorsque l’histoire de Colin Kaepernick a éclaté, par exemple, Wibbitz a permis à l’équipe de Coolong de produire une vidéo beaucoup plus rapidement que les deux heures qu’aurait mis un être humain pour écrire un script et l’éditer. Le grand inconvénient des systèmes automatisés, bien sûr, c’est qu’ils ne peuvent utiliser que des séquences déjà existantes.

~

Les géants de l’IA ont jusqu’à présent ignoré les journalistes. Google travaille sur les voitures autonomes, l’analyse des images et les applications de santé. La division Watson d’IBM a investi un milliard de dollars en « informatique cognitive », dans l’espoir de vendre des logiciels aux praticiens du droit, de la médecine, du marketing et du renseignement. Le journalisme ne fait pas partie de la liste – le marché n’est tout simplement pas assez grand. Mais quelques personnes s’acharnent à façonner l’IA du journalisme, ou du moins certains de ses composants. J’ai présenté quelques exemples majeurs, mais des dizaines de systèmes plus simples sont déjà opérationnels : des systèmes d’alerte qui surveillent les dépôts judiciaires, la supervision automatisée des financements de campagne, et toutes sortes de bots à usage unique, qui écrivent des articles sur les tremblements de terre, les prix des actions ou les vagues de criminalité. Nous pourrions construire Izzy dès aujourd’hui. Les éléments existent. Avec la technologie commerciale de reconnaissance vocale, nous pourrions les relier pour créer un puissant assistant de journaliste, l’autre moitié d’une équipe de journalistes humain-plus-machine. Ce qui nous manque, c’est un endroit pour intégrer toutes les fonctionnalités que les journalistes-développeurs créent déjà pour leur propre travail, et héberger toutes les données qu’ils peuvent partager. Sans une telle plateforme, les travaux des rédacteurs de journaux resteront fragmentés. Izzy pourrait s’inspirer de robots comme Alexa d’Amazon, qui peut être mis à niveau en installant des « compétences ». Les journalistes devraient être en mesure d’ajouter les compétences « crime organisé », « financement de campagne » ou « surveillance sismique ». Peut-être y parviendrons-nous bientôt. Ces compétences sont élaborées par des acteurs novateurs de l’information, l’une après l’autre. L’IA fait indéniablement irruption dans le journalisme, mais peut-être pas de la façon qu’on aurait pu imaginer. Il faudra beaucoup de temps avant qu’une machine batte les humains dans le journalisme, mais les journalistes assistés de logiciels intelligents – les reporters cyborgs – ont d’ores et déjà dépassé les anciennes limites du seul cerveau humain.

Traduit de l’anglais par Juliette Murray d’après l’article « The age of the cyborg », paru dans la Columbia Journalism Review. Couverture : Un journaliste et son robot. (DR/Ulyces)

JOSHUA TOPOLSKY, L’HOMME QUI PRÉDIT LA FIN DE TWITTER

Entretien avec le co-fondateur de The Verge et ancien directeur de Bloomberg Digital, après la publication d’un article prédisant la chute du réseau social.

Depuis la création de The Verge et notre entretien avec lui, alors qu’il était encore à la tête du magazine, Joshua Topolsky a fait bien du chemin. Après avoir contribué à la fondation de Vox Media et au succès de son magazine phare, Topolsky a quitté la barque en août 2014 pour prendre la tête de Bloomberg Digital. Un an après sa nomination et la refonte du site Bloomberg.com, il a abandonné son poste après que Michael Bloomberg a émis l’hypothèse qu’il n’avait peut-être pas besoin d’un site. Le sarcasme avec lequel Topolsky a accueilli l’idée a mis l’entrepreneur hors de lui, et les deux hommes ont convenu qu’il valait mieux que Tolpolsky s’en aille. Depuis, Joshua Topolsky est un cœur à prendre. Hier, il publiait sur le site du New Yorker un article intitulé « The End of Twitter », dans lequel il prévoit la mort du réseau social si ses fondateurs ne parviennent pas le sortir de la situation difficile dans laquelle il se trouve. Une série de changements peu inspirés apportés au produit, la stagnation de sa base d’utilisateurs, ainsi que la fuite massive de ses cerveaux ces derniers jours sont selon lui responsables de la situation – sans oublier le peu de contrôle que la compagnie a sur l’activité de sa plateforme. https://twitter.com/joshuatopolsky/status/693175653718433793?ref_src=twsrc%5Etfw Depuis sa publication, Topolsky fait les frais des mêmes attaques qu’il dénonce dans l’article, ce dont l’ironie ne lui a pas échappé. Il y évoquait notamment la responsabilité des utilisateurs du « Gamergate », qui avaient inondé de menaces et d’insultes le compte d’Anita Sarkeesian, vidéoblogueuse américano-canadienne qui avait dénoncé la misogynie dans les jeux vidéo. Visiblement, c’est au tour de Topolsky de subir leurs attaques. https://twitter.com/joshuatopolsky/status/693184110878138369?ref_src=twsrc%5Etfw Nous nous sommes entretenus avec lui à l’été 2014, quelques semaines avant son départ de The Verge. Cet entretien dans lequel il raconte ses multiples aventures médiatiques est l’occasion d’apprendre à connaître l’une des personnalités les plus incontournables de l’Internet américain.

Ces journalistes entraînent des intelligences artificielles à démasquer la corruption (2)

Mensonges répétés

Construire un cyborg

~

JOSHUA TOPOLSKY, L’HOMME QUI PRÉDIT LA FIN DE TWITTER

Entretien avec le co-fondateur de The Verge et ancien directeur de Bloomberg Digital, après la publication d’un article prédisant la chute du réseau social.

IL VOUS RESTE À LIRE 90 % DE CETTE HISTOIRE

Vous aimerez sûrement

Facebook pourra-t-il se relever du scandale Cambridge Analytica ?

À quoi ressemblera le sexe du futur ?

Qui étaient les premiers thugs ?

Quand votre job est de prédire la fin du monde