A la Silicon Valley, les accords se multiplient pour permettre aux entreprises technologiques de se servir légalement des contenus disponibles sur Internet pour nourrir leurs IA. Le dernier en date aurait été signé entre Google et Reddit. Le géant du numérique compterait verser 60 millions de dollars par an au réseau social pour entraîner ses modèles. Ce deal s’inscrit dans une tendance croissante qui concerne en priorité les acteurs de l’information. Axel Springer, AP, Semafor, et certains grands médias français font le choix de se lier aux géants de l'IA générative, faute d'accord global sur les droits des éditeurs. Avec, comme effet secondaire, la déstabilisation d'acteurs de moindre envergure.
Google to pay Reddit $60 million per year for faster access to its content that it has access to already that no one wants to see rank highly in Google Search anyway https://t.co/T3gYvAcBKk pic.twitter.com/pNOoMTDTiq
— Barry Schwartz (@rustybrick) February 23, 2024
Deals entre OpenAI et la presse : un pari risqué ?
On vous en parlait ici, le géant de l'édition allemand Bild a conclu un partenariat historique avec OpenAI fin décembre. Dans le cadre de cet accord, Axel Springer autorisera OpenAI à utiliser le contenu de ses médias, notamment Bild, Politico et Business Insider, pour entraîner des modèles d'intelligence artificielle. Le principal objectif du groupe ? Améliorer la qualité des réponses données par ChatGPT grâce à ses articles de presse tout en assurant la pérennité économique de ses médias.
En juillet, l’agence de presse américaine Associated Press (AP) annonçait également avoir conclu un accord avec la start-up, lui « conférant une licence d'utilisation pour une partie de ses archives de presse ». La publication des contenus n’était cependant pas concerné. Dans cette continuité, le site d’information politique Semafor a récemment développé un outil de recherche en partenariat avec OpenAI piloté par l'IA appelé MISO (pour « multilingual insight search optimizer »). Celui-ci permet aux journalistes de trouver et de résumer efficacement un large éventail d'articles dans différentes langues, facilitant ainsi le processus de curation de contenu. L'entreprise décrit l'outil comme « un robot personnalisé construit sur la plateforme OpenAI et utilisant le moteur de recherche Bing de Microsoft ».
Selon Mind Media, un partenariat inédit aurait également été noué entre Microsoft et les journaux Ouest France et Le Monde afin de « les aider à appliquer les fonctionnalités de l’intelligence artificielle générative à leurs activités rédactionnelles ». Ce serait le premier accord de ce type entre des médias français et une entreprise technologique de cette envergure.
Pendant ce temps, le New York Times pourrait peut-être gagner son procès contre OpenAI…
C’est ce que sous-entendent Timothy B. Lee, journaliste spécialisé dans les droits d’auteur, et James Grimmelmann professeur de droit spécialisé sur la propriété intellectuelle dans un article pour ArsTechnica. Le New York Times intentait fin décembre un procès à Open AI pour violation des droits d’auteur. L’argument principal en faveur d’Open AI serait que « Nous apprenons tous gratuitement ». L’article souligne cependant que : « Le raisonnement semble être que s'il est légal pour un être humain d'apprendre à partir d'un livre protégé par le droit d'auteur, il doit également être légal pour un grand modèle de langage d'apprendre à partir d'un million de livres protégés par le droit d'auteur » avant de poursuivre : « l’utilisation équitable dans un contexte personnel ou universitaire peut ne pas l'être si elle est pratiquée à l'échelle commerciale ».
En effet, la loi mentionne spécifiquement l'enseignement et la recherche comme exemples d'utilisation équitable. Mais pour les deux experts, les entreprises d'IA, comme OpenAI, utilisent des matériaux protégés par des droits d'auteur d'une manière qui pourrait ne pas être considérée comme une utilisation équitable, surtout lorsque les modèles génèrent des contenus qui concurrencent directement les œuvres originales. A l'époque, MP3.com et Texaco avaient perdu leurs arguments concernant l'utilisation équitable, tandis que Google a eu gain de cause. Aujourd'hui, les marchés des licences sont bien plus matures face à l'exploitation numérique des contenus et le problème de "mémorisation" des IA génératives...
En attendant des accords viables, de plus en plus de médias bloquent les robots d’exploration web (crawlers) des IA afin de protéger leurs données. Selon un relevé du Reuters Institute, à la fin de l'année 2023, 48 % des sites d'information les plus utilisés dans dix pays bloquaient les robots d'OpenAI. Un plus petit nombre, 24 %, bloquait le crawler d'IA de Google. Une tentative de protection pour préserver tant bien que mal leur modèle économique et le trafic sur leurs sites.
Google grand sauveur des éditeurs ?
Dans un contexte économique difficile, Google se positionne comme sauveur des éditeurs avec son nouvel outil de gestion des paywalls dynamique « Offerwall ». Difficile à croire sachant que le crawler de son IA Gemini participe également à l’absorption des données des médias – et fragilise donc leur modèle économique. L’outil permet aux lecteurs de débloquer l'accès au contenu de leurs sites web en choisissant parmi une série d'options telles que l'achat d'un abonnement, la visualisation d'une publicité vidéo, le partage de données personnelles (en spécifiant leurs intérêts parmi une liste de choix), ou un micropaiement pour un accès à court terme. Google présente Offerwall comme un « moyen pour les éditeurs de diversifier leurs revenus et d'explorer des approches de monétisation alternative ».
CETTE SEMAINE EN FRANCE
- « Qui veut voir dormir ma sœur » : l’horreur d’un Discord français à peine caché (Numérama)
- Pluralisme : l'affaire CNews vire au casse-tête pour l'Arcom (Les Echos)
- Sciences Po : souffrances en silence à l’école de journalisme (Arrêt sur Images)
3 CHIFFRES
- À la fin de l'année 2023, 48 % des sites d'information les plus utilisés dans dix pays bloquaient les robots d'OpenAI, d’après une étude du Reuters Institute of Journalism.
- Substack annonce avoir dépassé les 3 millions d'abonnements payants sur sa plateforme, selon leur communiqué.
- 1 500 milliards de dollars - la valeur de marché de Nvidia, le fabricant de puces qui alimente l'intelligence artificielle, a bondi de plus de 1 500 milliards de dollars au cours des 12 derniers mois, d’après CNBC.
LE GRAPHIQUE DE LA SEMAINE
- YouTube représente 9% du temps TV aux USA
Source : Nielsen
NOS MEILLEURES LECTURES / DIGNES DE VOTRE TEMPS / LONG READ
- Un chatbot qui imite les morts. Est-ce une bonne idée ? (Financial Times)
- Comment Sora fonctionne (et ce que cela signifie) (Every)
- Les firmes d'IA contournent vos blocages, devenus inefficaces (The Verge)
- Les « shukanshi », ces tabloïds racoleurs qui révèlent l’envers du décor au Japon (Le Monde)
- La course de la Chine pour dominer les IA s'accompagne d'un revers de médaille : elle dépend de la technologie américaine (NYT)
- Le nouveau métier de l'IA ? Collaborateur polyvalent d'Hollywood (The Hollywood Reporter)
- TikTok est sur le déclin (Slate)
DISRUPTION, DISLOCATION, MONDIALISATION
- L'engouement pour l'IA s'estompe, d'après les résultats des appels d'offres (Yahoo Finance)
- Google teste la disparition de l’onglet « Actualités » dans ses résultats de recherche (NiemanLab)
help @google where is my "news" tab pic.twitter.com/6ouIaWhwKP
— Sarah Scire (@SarahScire) February 21, 2024
DONNEES, CONFIANCE, LIBERTÉ DE LA PRESSE,DÉSINFORMATION
- OpenAI suspend le développeur d'un chatbot se faisant passer pour un homme politique (AI)
- Le personnel de Meta a découvert que l'outil d'abonnement à Instagram permettait l'exploitation des enfants. L'entreprise a quand même continué (Wall Street Journal)
- Une nouvelle étude montre que les gens peuvent changer d'avis sur la théorie du complot (The Conversation)
LÉGISLATION, RÉGLEMENTATION
- Les géants du numérique signent un accord contre l’utilisation trompeuse de l’IA dans le cadre d’élections (Le Monde)
- Julian Assange risque un "déni de justice flagrant" s'il est jugé aux États-Unis, selon un tribunal londonien (The Guardian)
- TikTok visé par une enquête de la Commission européenne concernant la protection des mineurs (Commission européenne)
Nous ouvrons une procédure formelle pour déterminer si Tik Tok a pu enfreindre le règlement sur les services numériques (#DSA) dans certains domaines :
▪️ protection des mineurs
▪️ publicité
▪️ accès aux données pour les chercheurs
▪️ gestion des risques
▪️ contenu préjudiciable— Commission européenne 🇪🇺 (@UEFrance) February 19, 2024
JOURNALISME
- Les éditeurs testent le nouvel outil de monétisation Offerwall de Google (ToolKits)
- AP lance un programme de formation à l'IA et couvre l'expansion grâce à deux nouvelles subventions (AP)
- Vice Media cesse de publier sur son site web et supprime des centaines d'emplois (BBC)
- Les éditeurs testent un nouvel outil de monétisation de Google appelé Offerwall (Toolkits)
STORYTELLING, NOUVEAUX FORMATS
- L'ascension incertaine d'Instagram en tant que site d'information (New York Times)
- Une nouvelle étude se penche sur les effets positifs du croisement du journalisme et de la comédie (NiemanLab)
RÉSEAUX SOCIAUX, MESSAGERIES, APPS
- Les "micro-influenceurs" vont-ils faire basculer les élections américaines ? (Financial Times)
- Google va payer 60 millions de dollars par an à Reddit pour entraîner ses modèles et se servir de ses contenus (Reuters)
- Les applications de rencontres Tinder et Hinge sont conçues pour rendre les utilisateurs dépendants, selon une action en justice (CBS news)
- Les influenceurs de TikTok gagnent beaucoup d'argent grâce aux streams (ABC)
- Reddit va enfin entrer en Bourse (Les Echos)
Fun to talk Reddit with @andrewrsorkin this morning. Going to be a rough ride for the company as it goes public. $RDDT https://t.co/ADzaxm5s7c
— Alex Kantrowitz (@Kantrowitz) February 23, 2024
IMMERSION, 360, VR, AR
- Pleurer avec Apple Vision Pro (Wired)
- Les fans du jeu Kim Kardashian se préparent à la fin de leur vie virtuelle somptueuse (Wall Street Journal)
STREAMING, OTT, SVOD
- YouTube domine le streaming TV aux États-Unis, selon le dernier rapport de Nielsen (TechCrunch)
- Comment Marvel se réinvente discrètement en réponse à la lassitude des superhéros (Hollywood Reporter)
AUDIO, PODCAST, BORNES
- Apple déclare que Spotify veut un accès "illimité" à ses outils sans payer (The Guardian)
INTELLIGENCE ARTIFICIELLE, DATA, AUTOMATISATION
- Google DeepMind crée une nouvelle organisation axée sur la sécurité de l'IA (TechCrunch)
- La course à la domination de l'I.A. par la Chine s'accompagne d'un revirement : elle dépend de la technologie américaine (New York Times)
- Stable Diffusion revient en force avec une toute nouvelle IA : Cascade (lebigdata)
- Les Émirats arabes unis soutiennent l'idée de Sam Altman de se transformer en terrain d'essai de l'IA (Bloomberg)
- Google offre une partie de l'intelligence artificielle qui alimente les chatbots (New York Times)
- Google interrompt la génération d'images de personnes par l'IA à la suite de réactions négatives sur la diversité (Financial Times)
We're aware that Gemini is offering inaccuracies in some historical image generation depictions. Here's our statement. pic.twitter.com/RfYXSgRyfz
— Google Communications (@Google_Comms) February 21, 2024
MONÉTISATION, MODÈLE ÉCONOMIQUE, PUBLICITÉ
- LVMH va à Hollywood pour mettre ses marques à l'écran (Financial Times)
Kati Bremme, Alexandra Klinnik et Aude Nevo