NAMS 2024 : IA, comment dompter la bête ?
L’IA sous un angle éditorial est rafraîchissante après l’effervescence des célébrations technologiques. NAMS, le Nordic AI in Media Summit, est exceptionnel à plus d’un égard : tout d’abord, parce que c’est un événement qui réunit les utilisateurs aguerris de l’IA dans les rédactions nordiques et les meilleurs experts médias et académiques du monde : On y croise David Caswell, Agnes Stenbom, Ezra Eeman, Natali Helberger, Jeff Jarvis, Nicholas Diakopoulos, Melissa Heikkilä, pour n’en nommer que quelques-uns. Puis c’est un endroit d’échange d’expériences concrètes au sein d’une communauté un peu en avance sur le reste du monde.
Kati Bremme, Directrice Innovation et Rédactrice en chef Méta-Media
Après une année 2023 ‘Waouh’, où il était difficile de distinguer le battage médiatique de la réalité, 2024 marque l’année de l’intégration concrète de l’IA dans les rédactions. La magie s’est quelque peu évaporée et laisse la place au pragmatisme. On passe des expérimentations à la productivité. On pourrait d’ailleurs regretter que l’intégration de l’IA dans la plupart des rédactions soit principalement motivée par la recherche d’efficacité plutôt que par le désir de stimuler la créativité. A l’avenir, nous devrions certainement étendre l’utilisation de l’IA au-delà de la simple efficacité accrue de ce que nous faisons déjà. Mais en attendant, il faut survivre.
D’un assistant de rédaction à l’outil pour proposer des formats pour les jeunes publics, les applications de l’IA dans les rédactions créent déjà de la valeur. Bien que l’ensemble des intervenants reconnaisse la difficulté actuelle de mesurer l’impact économique et le retour sur investissement, Nicholas Diakopoulos met en avant, à travers une enquête récente menée avec l’Associated Press, que 74 % des rédactions interrogées ont intégré l’intelligence artificielle à leurs processus.
Et comme aux débuts de la transformation numérique, c’est la presse écrite qui avance rapidement, en tout cas ici dans le Nord, devant le décor de Pressen, où autrefois au sous-sol résonna le ronronnement des rotatives pour imprimer les journaux papier, disparues depuis. Un petit rappel de la nécessité d’adaptation face au changement. Pendant que les uns se figent en sidération face à l’appétit insatiable des big tech qui ont dévoré sans gêne les contenus produits par les médias pour entraîner leur mémoire, d’autres testent des solutions IA qui peuvent potentiellement sauver les rédactions de leur disparition.
Présentation de David Caswell
Dans les cas d’usage concrets présentés au NAMS certains adoptent une approche holistique, tandis que d’autres répondent à un besoin spécifique (souvent selon les moyens disponibles dans les rédactions).
Les IA super-collaborateurs
Tore Rich, chef de produit pour l’IA générative chez l’éditeur danois JP/Politikens Hus, a présenté MAGNA, un chatbot multitâche fonctionnant sur Microsoft Azure. Développé avec les journalistes de ExtraBladet, MAGNA est une aide précieuse dans les tâches du quotidien avec 3 principaux groupes de fonctionnalités : « Ask the archive », basé sur la recherche sémantique pour proposer des sommaires, des rappels des faits et même faire une première ébauche d’un article ; un outil d’aide à la rédaction pour raccourcir un article, l’améliorer, proposer des contenus similaires ; et un support au Live avec une mise à jour automatique du sommaire et l’identification de sujets dans les commentaires, le tout toujours avec un humain dans la boucle. Les développeurs n’ont pas encore travaillé sur le process d’onboarding des journalistes, mais ont soumis une idée : commencez par quelques utilisateurs heureux qui feront passer l’information…
Un peu dans la même veine, Jody Doherty-Cove de Newsquest AI a présenté une interface qui propose à partir de notes (vérifiées) une première ébauche d’article. 3500 articles assistés par IA seraient publiés de cette façon chaque mois par 12 « journalistes IA » distribués dans tout le Royaume-Uni. Dans son portfolio, il y a le Berrow’s Worcester Journal, l’un des plus anciens journaux du monde, qui, en intégrant l’IA dans ses process, a réussi à dégager du temps que les journalistes passent désormais avec la communauté. Pour lui, l’IA est le bon outil au bon moment : à une époque où les éditeurs de contenu se retirent des algorithmes aléatoires des réseaux sociaux, l’IA pourra permettre davantage de découvrabilité (à condition de disposer des méta-données nécessaires).
Aftonbladet a formé 260 journalistes à l’art du prompt
Martin Schori et Elin Wieslander du journal suédois Aftonbladet ont présenté plusieurs façons dont ils adoptent l’IA, certaines très créatives. Au sein de leur AI Hub, une équipe de sept personnes issues de différents services de l’entreprise, travaille à temps plein pour explorer les solutions d’IA et former leurs collègues. Ici aussi, on a opté pour une solution d’interface intégrée, le « Buffet IA ». Celui-ci comprend un outil pour aider les journalistes à trouver des idées d’angle sur un sujet (un ‘brainstormer‘) un assistant pour optimiser le SEO, un assistant pour la relecture dans le style de Aftonbladet, et un outil « Assistant Jeunesse » pour créer des encadrés informatifs, des chronologies et d’autres formes de contenu qui sont populaires auprès des jeunes publics. Les plus plébiscités par la rédaction : justement, ce « fact-box », un résumé de faits contextualisé dans un article, la transcription / traduction, et l’aide au SEO.
‘L’Assistant Jeunesse’ de Aftonbladet
Comment ont-ils convaincu leur direction, sans le soutien de laquelle la meilleure stratégie IA reste peu utile ? Ils ont rappelé que l’avance de Aftonbladet lors de la transformation digitale provenait du fait qu’ils étaient parmi les premiers à équiper les journalistes avec des iPhones. Ils ont donc posé la question : « Voulez-vous rater cet instant iPhone ? ». Toutefois, un petit bémol subsiste : malgré une réelle attente de résultats, la technologie n’est pas encore au point pour tous les cas d’usage.
Une boîte à outils
Aida Kokanovic de Danmarks Radio (DR) a décrit deux outils qu’elle a développés avec sa rédaction pour aider et démocratiser la recherche en Open Source. L’un d’eux est une « Machine à Chronologies » : un outil capable d’analyser de grandes quantités de documents pour la recherche de données dans des PDF, qui les segmente en conséquence, puis les classe dans l’ordre chronologique. Ces sections sont ensuite résumées en utilisant la technologie d’OpenAI. Il a entre autres servi dans le scandale du glissement de terrain chez Nordic Waste au Danemark pour analyser 16 430 pages de documents.
Une seconde solution, Nebula, aide les journalistes à générer des idées d’articles autour d’une certaine thématique, en suggérant des manières de développer différents angles, de définir des objectifs et des périmètres. Il offre également une aide pratique, en proposant des outils OSINT et en intégrant des tutoriels vidéo.
Un outil
Face aux IA multitâches, Lasse Funder Andersen, responsable IA à la DR, nous rappelle que parfois, on a juste besoin du bon outil pour la bonne tâche, comme un expert en lecture et en extraction de métadonnées. Cependant, l’entraînement n’était pas facile pour autant pour obtenir les résultats attendus avec l’agent pré-entraîné (le P de GPT) : malgré des centaines d’exemples et d’explications détaillées sur la tâche, l’article et la fonction, il est crucial d’être le plus précis possible pour éviter des réponses inadéquates comme ‘Certainly, here is some lovely metadata for you‘. C’est seulement après avoir intégré une approche basée sur un ensemble de règles, comme la règle stipulant que les citations doivent être placées entre guillemets, qu’il a atteint un taux de succès de 99 %. Sa conclusion : ‘Nous sommes satisfaits de notre modèle ‘Rain Man’ et espérons pouvoir indexer l’ensemble de nos archives. »
Des tâches spécifiques dans les petites rédactions
L’IA est une aubaine pour les rédactions avec peu de moyens, surtout quand elles sont en capacité de s’associer à des experts. Elles arrivent alors même à contourner des idées arrêtées sur l’incapacité des LLM à maîtriser les langues minoritaires. La preuve en est faite par Masaana Egede de Sermitsiaq, journal national du Groenland, et Lars Damgaard Nielsen de la startup technologique MediaCatch qui ont présenté un outil de traduction que les deux entreprises ont développé ensemble. La structure agglutinative de la langue groenlandaise (bien pire que l’allemand) est un challenge pour tout traducteur : nalunaarasuartaatilioqateeraliorfinnialikkersaatiginialikkersaatilillaranatagoorunarsuarrooq est composé de 92 lettres et signifie : « une fois de plus, ils ont essayé de construire une station de radio, mais apparemment elle n’est encore qu’à l’état de projet ».
Le projet a utilisé des articles déjà traduits par des journalistes de Sermitsiaq pour développer un nouvel outil de traduction de texte à texte qui propose une version plus précise du groenlandais au danois et vice versa. Il a été entraîné en appariant des phrases spécifiques en groenlandais et en danois tirées des articles pour inclure le contexte et a ensuite été évalué par des traducteurs humains. Cet outil de traduction est maintenant vendu dans le cadre d’un abonnement professionnel à Sermitsiaq, ce qui a permis de plus que doubler les abonnements numériques du média. Et l’avantage pour les journalistes : une tâche qui prenait 2 à 4 heures est désormais effectuée en 8 minutes. Un gain précieux pour une petite rédaction qui compte ses moyens.
Le journal iranien en exil, Zamaneh Media, utilise aussi les LLM pour transcender les barrières linguistiques. Lily Mafi, directrice de la communication et éditrice, a présenté leur outil qui automatise la création de résumés en anglais à partir d’articles rédigés en persan, et qui sert également à automatiser une newsletter avec l’objectif de rendre accessible leurs contenus à un plus grand public.
Sultan Suleimanov du journal russe Meduza
L’importance de rendre accessibles des langues non maîtrisées par un public nordique a été démontrée par Ines Hamdan, journaliste chez Sydsvenskan, qui a exposé les méthodes de storytelling de AJ+ sur la Suède. Selon les récits diffusés par le média qatari, le passe-temps préféré des Suédois serait de « brûler le Coran le matin, kidnapper un enfant à midi et rêver de l’OTAN le soir ». En utilisant une méthode quelque peu artisanale consistant à copier des informations dans ChatGPT, puis en lui demandant un clustering par mots clés les plus utilisés, elle a réussi à révéler que la plupart des contenus sur la Suède provenaient en fait d’une agence de presse turque.
Des recommandations plus intelligentes
Le data scientist Jacob Welander a présenté l’approche du groupe Schibsted en matière de recommandation de contenu et de personnalisation. Le projet Curate implique l’automatisation partielle des pages d’accueil pour certains titres du groupe, où les premières positions sont encore contrôlées manuellement tandis que les autres sont déterminées par le système automatisé. Welander a expliqué comment le système de recommandation de contenu a commencé avec des simples « rankers », des algorithmes qui prennent une liste d’articles et les notent selon leur pertinence, pour ensuite être personnalisé en ajoutant différents sujets d’actualité comme valeur de classement afin de répondre aux intérêts variés au-delà de la démographie dominante – c’est-à-dire ne pas suggérer plusieurs articles de sport à tous les utilisateurs simplement parce qu’un large segment d’audience aime les articles de sport (en l’occurrence, les hommes).
C’est grâce au filtrage collaboratif, un processus qui relie les dimensions utilisateur et contenu, que les résultats ont gagné en pertinence. Ce système apprend les préférences des utilisateurs et leur relation au contenu, sans se baser sur des étiquettes ou d’autres marquages. Fondé sur les intérêts passés et les interactions avec les articles, ce filtrage permet de recommander de nouveaux articles. La recommandation de contenu est déjà en place sur la plupart des sites de Schibsted, avec Aftenposten qui personnalise actuellement 66 des 80 emplacements de sa page d’accueil pour les abonnés. Cette stratégie offre plusieurs avantages : une meilleure distribution de contenu de niche et un engagement accru des lectrices, notamment celles âgées de 30 à 39 ans. Le prochain défi est la personnalisation pour les utilisateurs non connectés.
3 générations de moteurs de recherche
Chez Podimo, l’IA facilite non seulement la découverte de podcasts d’archives, mais transforme également le moteur de recherche d’une simple machine de (non)découverte en un agent conversationnel. Après avoir appris à classer les podcasts et à exploiter la recherche sémantique, qui élimine le besoin de mots-clés précis, les équipes de Benjamin B. Biering travaillent désormais sur une découverte en conversation libre. Ce nouveau système, basé également sur un modèle pré-entraîné disponible sur Hugging Face, a triplé leur taux de conversion.
Doit-on instruire les LLM ?
Au sujet de la fâcheuse question des droits d’auteur deux mondes se sont affrontés : d’un côté, Natali Helberger, professeure à l’Université d’Amsterdam, qui est revenue sur le feuilleton de l’IA Act européen, qui n’adresse les questions du droit d’auteur que sous l’angle de la transparence.
De l’autre, le journaliste Jeff Jarvis, pour qui le concept du copyright est dépassé (cela lui rappelle d’ailleurs la bataille de la presse écrite contre l’arrivée de la radio) : « Nous nous lisons les uns les autres et apprenons les uns des autres. C’est ce que j’appelle une véritable panique morale. » Pour lui, « nous passons d’une ère de premières pages et d’une ère de recherche et de réseaux sociaux à une ère de requêtes. Les gens peuvent poser des questions. » Si « l’IA générative ne devrait pas être utilisée pour écrire des articles de presse. Point final », les articles de presse devraient au moins servir à rendre plus intelligente l’IA, surtout dans un pays comme les États-Unis où tout est protégé par le copyright : « Voulons-nous des LLM de plus en plus stupides et de plus en plus ignorants ? » La monnaie à négocier n’est pas l’entraînement des modèles avec nos contenus (celle-ci est déjà perdue), mais l’accès à une information de qualité.
Se pose alors la question du pacte faustien avec les géants de la tech : partager ou ne pas partager, et à quel prix ?
Une transparence intelligente
Les recommandations de l’initiative Nordic AI Journalism (400 signataires essentiellement des Nordiques) sur la gestion de la Transparence, détaillées par Agnes Stenbom, Fondatrice & Directrice du IN/LAB, Schibsted, sont une excellente boussole pour toute rédaction à la recherche de bonnes pratiques :
- Transparence est requise quand l’IA est utilisée dans des contenus à fort impact journalistique
- Des utilisations internes de l’IA ne requièrent pas de transparence (amélioration SEO, transcription pour une utilisation interne, correction)
- Quand vous évoquez l’utilisation de l’A, précisez l’outil (ce qui est d’ailleurs obligatoire pour certains comme Dall-e, cf. les CGU)
- Les labels visuels ne font que brouiller la lecture, il vaut mieux expliquer la démarche, dans un vocabulaire harmonisé et partagé par tous les médias (qui pose la question du rôle que l’on attribue à l’IA) :
Dans l’industrie médiatique suédoise, l’expression choisie pour parler de l’intelligence artificielle est « avec le support de l’IA », car elle évite l’implication que les humains sont inférieurs à la technologie, suggérée par « avec l’aide ». Contrairement à « ensemble avec », elle ne prête pas de conscience à l’IA, et elle offre plus de précision que l’emploi de « via ».
‘Reality Check’
Pour finir, quelques idée clés de la prise de hauteur par Ezra Eeman dans son Reality Check :
- L’année dernière, nous avons vécu le big bang technologique, avec des questionnements autour de la mise en œuvre de l’IA générative et de son impact. Cette année, la question est plus précise, autour des écosystèmes de modèles de langage, l’efficacité et l’expérimentation, devant le bruit ambiant et des partenariats possibles.
La suite : la recherche sémantique et les agents, l’intégration stratégique, avec une véritable disruption dans les années à venir. - Quand les modèles aujourd’hui ont souvent encore des traces de coquille d’œuf qui sort juste d’un labo de recherche, l’IA générative évoluera dans les années à venir de plus en plus vers un Anything to Anything supermodèle, avec un axe fort sur le son et la vidéo. Nous sommes de plus en plus dépendants des big tech : la plupart des exemples montrés ont été hébergés sur Microsoft Cloud Azure (pas forcément adapté au finetuning selon les retours d’expérience des rédactions, NDLR).
- L’intelligence artificielle personnelle deviendra accessible à tous, agissant comme un supercalculateur de poche qui fonctionne sans connexion Internet, ce qui stimulera l’émergence d’une nouvelle génération de générateurs d’IA.
- Les applications autonomes d’IA évoluent pour s’intégrer dans des flux de travail plus larges, ce qui optimise les processus et les rendements.
- Nous assisterons à la naissance des Large Action Models, des modèles d’IA conçus pour comprendre les intentions et faciliter les interactions via des interfaces utilisateurs intuitives.
- Dans le domaine de l’IA, les fonctionnalités comme la transcription et l’assistance rédactionnelle deviennent standard ; l’innovation se trouve désormais dans le développement de formats novateurs.
- Pour atteindre ces objectifs, on observera une consolidation dans l’industrie des médias, avec de grands groupes contrôlant un portefeuille étendu de marques, parallèlement à un écosystème de créateurs extrêmement fragmenté.
Une histoire de pouvoir
Felix M. Simon, Oxford Internet Institute, nous a rappelé que l’objectif des entreprises technologiques était/est de construire, conserver et étendre de plus grandes bases d’utilisateurs et de contrôler l’accès à celles-ci. Et dans sa keynote finale, Melissa Heikkilä, journaliste IA au MIT, a ajouté par la démonstration que l’IA est loin d’être neutre et que tout ceci est une histoire de pouvoir. La journaliste avait testé l’appli Lensa alimentée par Midjouney avec un résultat publié dans un article du magazine du Massachusetts Institute of Technology. Elle a lancé un avertissement cinglant : ne laissons pas les marchands de Silicon Valley nous pousser des Turcs mécaniques coûteux et truffés de biais…
Melissa Heikkilä, journaliste IA au MIT
Et parfois, les IA génératives sont encore un peu limitées. Tove Mylläri, AI Innovation Lead chez Yle, a remarqué que le script généré par l’IA pour leur émission humoristique Miki and Köppi était bien trop « gentil ». En revanche, Hikikomori, un long format qui a utilisé l’IA de Tortoise pour faire ressentir l’expérience, est devenu l’une de leurs histoires les plus lues. Il s’agit d’utiliser l’IA au bon moment et pour le bon usage.
A emporter
Ne perdez pas de temps à apprendre aux journalistes à prompter, donnez-leur des solutions intégrées dans leurs outils. Collaborez, échangez. Dans un monde rempli d’IA, quelle est exactement la fonction du journalisme et le rôle des journalistes ? Il faudra être moins « d’actualité » et plus « de service ». Elle va augmenter le rôle du journalisme, mais ne devrait pas essentiellement modifier ses valeurs. Nos efforts doivent être ancrés dans nos missions uniques et nos valeurs journalistiques fondamentales, mais nous devons réinventer les manières dont nous réalisons ces principes pour nous positionner stratégiquement dans un écosystème d’information propulsé par l’IA, qui sera fondamentalement différent du paysage actuel.
De quelles nouvelles compétences avons-nous besoin dans les rédactions ?
- De la patience (la technologie n’est pas forcément au point)
- De la curiosité (apprendre à apprendre, y compris d’autres industries)
- De l’ouverture (il est essentiel de privilégier une collaboration collective pour les projets IA)
- De la disponibilité (pour co-construire les outils adaptés) et utiliser la technologie pour abattre les barrières technologiques.
Kalle Kovacs, éditeur numérique au SR, a rappelé quelques bonnes pratiques du prompt, pour les rédactions qui n’ont pas la chance de disposer d’un outil sur mesure : parfois, il suffit de dire au bot de ne pas « inventer des faits ». Et il faut tout remettre en question, tout le temps…
Kalle Kovacs, éditeur numérique au SR, devant les réactions des journalistes de la SR
Pour ne pas basculer de l’utopie à la dyschronie et se retrouver piégés dans le labyrinthe magique du buzz étincelant de l’IA générative, il faut tester, co-construire des outils avec les rédactions, et toujours se poser la question de la valeur ajoutée pour les publics. Dans quelques années, aura-t-on encore besoin de labéliser les contenus créés avec l’IA ou cela reviendrait-il au même que si l’on disait aujourd’hui « Cet article a été rédigé avec le support d’Internet ? » Pour Ezra Eeman, les IA génératives sont ni des machines à vérité, ni des machines à créativité. Nous devons exploiter l’IA pour enrichir et transformer nos offres d’information. Demain, on aura peut-être des agents IA qui nous recommanderont les infos sous forme liquide et prédigérée. Mais n’oublions pas que l’Internet n’est pas une technologie, mais un réseau d’humains, rappelle justement Jeff Jarvis. Pour l’IA c’est un peu le même enjeu : nous devons arrêter de la considérer sous l’angle technologique. Car des humains, il en faut encore pléthore pour l’IA. L’IA est magique, mais surtout humaine. Démonstration faite lors de ces deux jours profondément inspirants à Copenhague, et dans le making of de la vidéo Sora Air Head de la boîte shy kids ci-dessous :
Illustration de l’article : image générée par IA, capture de la présentation de Lasse Funder Andersen, responsable IA à la DR