Meta a tellement besoin de sources de données pour entraîner son IA qu'elle a envisagé de risquer des poursuites pour droits d'auteur : rapport

Meta a tellement besoin de sources de données pour entraîner son IA qu'elle a envisagé de risquer des poursuites pour droits d'auteur : rapport

Les géants de la technologie se démènent pour trouver de nouvelles sources de données pour alimenter la course aux armements en matière d’IA.

Et chez Meta, le problème est si critique que les dirigeants se sont réunis presque quotidiennement en mars et avril de l'année dernière pour élaborer un plan, a rapporté le New York Times.

À mesure que les systèmes d’IA deviennent plus puissants, les entreprises technologiques ont été contraintes de rechercher des données de manière plus agressive, ce qui pourrait les exposer à d’éventuelles violations du droit d’auteur. Certains soupçonnent par exemple OpenAI d’utiliser YouTube pour entraîner son générateur vidéo, Sora. La directrice technique de l'entreprise, Mira Murati, a nié ces accusations.

Lors des réunions de Meta, le Times a rapporté que certains participants avaient lancé l'idée d'acheter la maison d'édition Simon & Schuster, que la société de capital-investissement KKR avait achetée pour 1,62 milliard de dollars en août dernier. D'autres ont suggéré de payer 10 $ par livre pour obtenir l'intégralité des droits de licence sur les nouveaux titres.

Au moment des réunions, Meta avait déjà résumé de nombreux livres, essais et autres ouvrages en ligne. La société avait embauché des sous-traitants en Afrique pour regrouper des résumés de titres de fiction et de non-fiction, dont certains incluaient des informations protégées par le droit d'auteur. « Nous n'avons aucun moyen de ne pas collecter cela », a déclaré un responsable lors d'une réunion.

Les participants ont discuté de la question de savoir si l'entreprise pouvait simplement continuer à collecter des données provenant de sources potentiellement protégées par le droit d'auteur sans prendre le temps et l'argent nécessaires pour conclure des accords de licence. Lorsqu'un avocat a souligné les préoccupations « éthiques » liées à l'appropriation de la propriété intellectuelle, il a été accueilli par le silence, a rapporté le Times.

Meta n'a pas immédiatement répondu à une demande de commentaire de Trading Insider.

En fin de compte, les dirigeants présents à la réunion ont décidé de s'appuyer sur le précédent établi en Guilde des auteurs contre Google, une affaire judiciaire portée en 2015 devant la Cour suprême. Le tribunal a refusé d'entendre l'affaire, confirmant une décision d'un tribunal inférieur. Ce tribunal a déclaré que Google pouvait numériser et numériser des livres pour Google Books conformément aux directives d'utilisation équitable. Les avocats de Meta ont déclaré que l'entreprise pourrait former ses systèmes d'IA selon les mêmes directives, a rapporté le Times.

A lire également