Meta a possiblement entraîné son IA avec des livres piratés

Par Thomas Povéda Le 12/01/2024 0 com

Dans un procès qui l'oppose à plusieurs ayants droit, Meta admet avoir entraîné son IA avec des parties d'une base de données contenant des livres piratés. L'entreprise nie avoir violé les droits des auteurs concernés.

Nous vous parlons assez souvent d'intelligence artificielle. La technologie a fait un immense bond en avant et l'arrivée de ChatGPT notamment l'a rendu accessible au plus grand nombre. Si vous utilisez ce chatbot ou un autre de temps en temps, vous savez que les réponses fournies sont le fruit d'un entraînement. Des milliards de données ont été transmises aux l'IA afin qu'elles apprennent quoi dire selon ce qu'on leur demande. Le principe est le même quel que soit le but recherché : détecter une maladie, lire dans les pensées, générer des images…

Et c'est justement ce procédé qui pose de plus en plus de problèmes aujourd'hui. Dans l'immense majorité des cas, les données permettant de développer les intelligences artificielles sont récupérées à la source la plus fournie qui soit : Internet. Sauf que sur le Web, on trouve des textes et des œuvres libres de droits certes, mais aussi beaucoup d'autres protégées par des droits d'auteur. À mesure que le temps passe, les personnes concernés multiplient les attaques en justice. C'est ainsi qu'OpenAI, à l'origine de ChatGPT, se retrouve empêtré dans des procès sans fin. La maison-mère de Facebook, Meta, est également sous le coup de plusieurs actions judiciaires.

Meta est accusé d'avoir entraîné son IA avec du matériel protégé par droits d'auteur

Pour comprendre pourquoi Meta est visé ici, il faut remonter en 2020. Cette année-là, Shawn Presser, chercheur en intelligence artificielle crée Book3. Il s'agit d'une base de données reprenant le contenu du site Bibliotik, alors hébergé publiquement par le collectif The Eye. À l'intérieur, 195 000 livres regroupés dans 37 Go de données à des fins d'archivage. Avec Book3, l'objectif de Presser est d'offrir des donnés à tous ceux qui veulent développer un modèle d'IA. Le problème, c'est que dans le tas, il y a des livres protégés, donc piratés.

Book3 reste accessible pendant des années avant de disparaître progressivement des sites Web sur lesquels l'archive est hébergée. À la demande d'ayants droit bien sûr. Avant cela, les grands noms de la Tech comme Meta ont eu largement le temps de s'en servir, et c'est bien ça que les plaignants reprochent à la firme. Le procès est actuellement en cours, mais des documents montrent comment le groupe de Mark Zuckerberg compte se défendre. Dans un premier temps, Meta admet avoir utilisé Book3 pour entraîner son IA.

L'IA de Meta a peut-être reçu des livres piratés en guise d'entraînement, l'entreprise nie

On peut ainsi lire : “Meta admet avoir utilisé des parties de l'ensemble de données Books3, parmi de nombreux autres matériaux, pour entraîner Llama 1 et Llama 2”. Il s'agit de ses modèles de langage, dont la 2e itération est disponible depuis l'été 2023. La question est maintenant de savoir si cela constitue une infraction aux droits d'auteur. Par exemple, les plaignants disent que Mera aurait dû demander la permission d'utiliser leurs œuvres. Mais “Meta nie que son utilisation d'œuvres protégées par le droit d'auteur pour entraîner Llama ait nécessité un consentement, un crédit ou une compensation”. Et pas la peine de parler de piratage puisque “Meta nie avoir violé les droits d'auteur présumés des plaignants”.

Pour justifier son utilisation de Book3, Meta se cache derrière la notion de “fair use”, ou usage raisonnable, en indiquant que “les copies non autorisées des œuvres protégées par le droit d'auteur […], constituent une utilisation équitable […]”. La tactique est connue et largement répandue dans ce genre d'affaires liées à l'intelligence artificielle. Elle s'applique d'ailleurs aussi bien aux œuvres supposément piratées que celles publiées sur des canaux accessibles publiquement mais utilisées sans permission.

Ce procès et les autres n'en sont qu'à leur début et beaucoup de choses peuvent se passer d'ici le rendu d'une décision. En dernier recours, c'est la Cour Suprême américaine qui pourrait être amenée à trancher. Quel que soit le verdict final, il aura un impact significatif sur le développement futur des intelligences artificielles.

Source : TorrentFreak

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Meilleur smartphone : quel modèle acheter en 2026 ?
Quel est le meilleur smartphone en 2026 ? Difficile de trancher, car la réponse est très variable. Tout dépend de ce que vous recherchez : puissance, autonomie, performances en photo ou budget… Quels que soient vos critères, vous trouverez dans…

Guides d'achat smartphones 31/12/2025
YouTube : cette simple méthode permet d’accéder à du contenu pornographique, mais que fait Google ?
Un utilisateur de Reddit a découvert qu’en tapant une simple recherche, il est possible de visionner une grande quantité du contenus pour adulte sur YouTube. Personne ne sait depuis quand cette faille est opérationnelle et exploitée par les internautes. YouTube…

Actualités 31/12/2025
Cet expert est terrifié par les capacités de l’IA et veut qu’on la débranche avant qu’il ne soit trop tard
Yoshua Bengio est l’un des hommes qui a aidé à créer l’intelligence artificieille telle qu’on la connaît aujourd’hui et pourtant, il milite désormais pour sa mise à mort. En effet, un point l’inquiète profondément : sa capacité à s’auto-préserver. Depuis…

IA 31/12/2025
WhatsApp : ne manquez pas ces 4 nouveautés pour fêter le Nouvel An avec vos proches, même à distance
Dans seulement quelques heures, 2025 tirera sa révérence pour accueillir 2026. Pour célébrer la nouvelle année comme il se doit, même à distance, WhatsApp lance plusieurs nouveautés festives qui viennent prendre place un peu partout dans l’application : messages, appels vidéo,…

Applications 31/12/2025
Il commande une RTX 5080 à 1200 dollars et reçoit une pile de cailloux (mais l’histoire se finit bien)
Encore un acheteur malchanceux d’une carte graphique payée à prix d’or. Cette fois, notre protagoniste a reçu une boîte remplie de cailloux. Heureusement pour lui, c’est justement cette mauvaise surprise qui lui a permis de résoudre l’affaire. On a déjà…

Carte graphique 31/12/2025
Stranger Things saison 5 enchaîne les records alors même que l’épisode final n’a pas encore été diffusé
Entre une attente interminable et un calendrier de sortie fragmenté, Netflix a mis la patience des fans de Stranger Things à rude épreuve. Pourtant, le succès est au rendez-vous : les audiences explosent et ce n’est pas encore fini… il…

Netflix 31/12/2025
Ce robot de cuisine Ninja 3-en-1 est à prix sacrifié, c’est le mixeur qu’il manque à votre cuisine !
Vous connaissez probablement Ninja pour ses airfryers au rapport qualité-prix imbattable. Le géant américain toute une gamme d’appareils de cuisine qui facilitent la vie. Si vous cherchez un mixeur ultra puissant à prix cassé, ce bon plan est fait pour…

Bons plans 31/12/2025
iPhone 17 Pro : un mystérieux bruit parasite de « vieille radio » inquiète les utilisateurs
Les iPhone 17 Pro et 17 Pro Max sont de nouveau sur le devant de la scène à cause d’un nouveau problème. Après la décoloration et le « Scratchgate », c’est au tour de leur haut-parleur de faire des siennes. Cela faisait…

iPhone 31/12/2025
Les vidéos générées par IA envahissent YouTube et génèrent des milliards de vues
Il devient de plus en plus difficile d’échapper au contenu généré par IA sur Internet, et encore plus sur YouTube. Selon une récente étude, un Shorts sur cinq disponible sur la plateforme a été entièrement créé grâce à l’intelligence artificielle….

YouTube 31/12/2025
Bon plan Google Pixel Buds Pro 2 : cette réduction de -40% fait chuter le prix des excellents écouteurs !
L’année se termine dans quelques heures et pour fêter l’arrivée de la suivante, Amazon brade les Pixel Buds Pro 2. Normalement en vente à 249 €, les écouteurs haut de gamme de Google passent exceptionnellement à 149,99 €. C’est un excellent…

Bons plans 31/12/2025

Newsletter