Meta accusé d’avoir utilisé des livres piratés pour entraîner son IA

Un groupe d'auteurs, dont l'écrivain Ta-Nehisi Coates et l'humoriste Sarah Silverman, poursuit Meta en justice, accusant l'entreprise d'avoir sciemment utilisé des livres piratés pour entraîner ses modèles d'intelligence artificielle.

facebook mark zuckerberg

Selon des documents judiciaires rendus publics cette semaine en Californie, Mark Zuckerberg aurait personnellement approuvé l'utilisation de contenus protégés par le droit d'auteur pour entraîner son intelligence artificielle.

Au cœur de cette controverse se trouve LibGen, une base de données contenant environ 32 téraoctets de livres numérisés, considérée comme une « bibliothèque de l'ombre » d'origine russe. D'après les plaignants, des communications internes révèlent que Zuckerberg a validé l'utilisation de LibGen malgré les avertissements de son équipe dirigeante concernant la nature piratée des contenus.

Lire égalementLe patron de l’IA de Microsoft affirme que le contenu public sur Internet est libre d’utilisation, et ça l’arrange bien comme ça

Mark Zuckerberg aurait approuvé cette pratique controversée

Les documents judiciaires citent notamment un mémo faisant référence aux initiales de Zuckerberg (« MZ »), indiquant que « après remontée à MZ », l'équipe IA de Meta a reçu l'autorisation d'exploiter LibGen. Les ingénieurs de l'entreprise auraient même discuté de l'accès à ces données, tout en exprimant des réserves quant au téléchargement de torrents depuis des ordinateurs professionnels.

Cette nouvelle action en justice fait suite à une première plainte déposée en 2023, rejetée par le juge fédéral Vince Chhabria. Les auteurs affirment que ces nouvelles preuves renforcent non seulement leurs accusations initiales d'atteinte aux droits d'auteur, mais pourraient également justifier l'ajout d'une accusation de fraude informatique.

Le contexte est particulièrement sensible pour Meta, qui utilise ces données pour entraîner Llama, son modèle de langage alimentant ses chatbots. L'année dernière, un tribunal fédéral de New York avait déjà condamné les opérateurs anonymes de LibGen à verser 30 millions de dollars de dommages et intérêts à un groupe d'éditeurs pour violation de droits d'auteur.

Cette affaire s'inscrit dans un débat plus large sur l'utilisation de contenus protégés pour l'entraînement des modèles d'IA générative. Les professionnels de la création et les éditeurs alertent sur les risques que ces pratiques font peser sur leurs moyens de subsistance et leurs modèles économiques.

Bien que le juge Chhabria ait accepté le dépôt d'une plainte amendée, il a exprimé des doutes quant aux chances de succès des accusations de fraude. Meta n'a pas encore répondu publiquement à ces nouvelles allégations.


Abonnez-vous gratuitement à la newsletter
Chaque jour, le meilleur de Phonandroid dans votre boite mail !
Réagissez à cet article !
Demandez nos derniers  !