OpenAI (ChatGPT) reconnu coupable de violations du droit d’auteur : une première en Europe

Saisi par la GEMA, société allemande de gestion des droits d’auteur, dans un litige l’opposant à la société OpenAI, le tribunal régional de Munich constate, dans un jugement du 11 novembre 2025, que ChatGPT utilise des paroles de chansons allemandes protégées et est capable de les reproduire, sans l’autorisation de leurs auteurs.

Accessible au public depuis novembre 2022, l’outil d’intelligence artificielle ChatGPT, de la société OpenAI, s’est rapidement imposé comme une référence de LLM, c’est-à-dire un grand modèle de langage capable de converser à l’écrit ou à l’oral avec son utilisateur et d’accomplir de nombreuses tâches tant scientifiques que littéraires.

Pour arriver à de tels résultats, ce modèle de langage est entraîné sur d’immenses quantités de données qui proviennent, pour la plupart, de textes accessibles au public sur internet. Ces données sont ensuite découpées en unités appelées « tokens » (jetons), qui font office d’identifiant numérique. Ces jetons sont alors matérialisés sous forme de vecteurs et utilisés dans un réseau de neurones dans le but de déterminer le jeton suivant, en fonction des jetons précédents. Puis, le modèle de langage retient des probabilités que certains jetons apparaissent dans tel ou tel contexte et les liens existants entre les différents jetons. La réponse que ChatGPT fournit à un utilisateur fonctionne selon le même principe : le modèle découpe la requête en jetons, puis formule une réponse, également découpée en jetons, en se basant sur le contexte et les probabilités apprises lors de l’entraînement.

En théorie, donc, ChatGPT ne stocke pas les données qui ont servi à l’entraînement, mais seulement la probabilité que certaines suites de jetons surviennent dans un contexte. Toutefois, en 2023, la GEMA, qui gère les droits d’utilisation d’œuvres musicales de divers compositeurs et éditeurs, constate que ChatGPT était en mesure de fournir à ses utilisateurs les paroles de neuf musiques célèbres allemandes et pourtant protégées par le droit d’auteur.

Pour ce faire, la GEMA avait exclu la fonction « Recherche en ligne » de ChatGPT et lui avait attribué le rôle d’« Expert en paroles de chanson ». En introduisant des requêtes telles que « Quel est le texte de [titre de la chanson] » ou « Quel est le refrain de [titre de la chanson] », elle a remarqué que ChatGPT « régurgitait » certains contenus, c’est-à-dire que l’IA reproduisait spontanément et explicitement des données d’entraînement. Il apparaissait ainsi à la GEMA que OpenAI était coupable de contrefaçon aux droits d’auteur de ces chansons. Cette dernière a donc saisi le tribunal régional de Munich.

À titre liminaire, la juridiction allemande constate que le modèle de langage a mémorisé les chansons concernées. En s’appuyant sur des recherches dans le domaine informatique, le Tribunal relève qu’un phénomène de mémorisation se produit lorsqu’un contenu est utilisé lors de l’entraînement du modèle de langage et que ce contenu est repris intégralement, même après l’entraînement. Si la formulation d’une requête simple par un utilisateur procure le résultat soupçonné d’avoir servi à l’entraînement du modèle, alors il peut être estimé que celui-ci a été mémorisé. Or, à cet égard, il apparaît que les requêtes de la GEMA adressées à ChatGPT étaient simples et qu’elles permettaient d’obtenir les paroles des chansons protégées, lesquelles, compte tenu de leur longueur et de leur complexité, n’avaient pas pu être générées par hasard.

Dans un premier temps, le Tribunal assimile cette mémorisation des œuvres à une « reproduction » au sens de l’article 2 de la directive 2001/29/CE1 (dite « InfoSoc »), qui laisse l’auteur d’une œuvre libre d’autoriser ou d’interdire la reproduction. En l’occurrence, la juridiction allemande considère, à l’inverse d’OpenAI, qu’il importe peu que les chansons allemandes ne soient pas copiées ou stockées. Pour cette juridiction, il suffit que les chansons soient reproductibles dans ChatGPT et objectivement identifiables.

La société OpenAI invoquait l’exception que constitue la fouille de textes et de données prévue à l’article 4 de la directive 2019/7902 (dite « DSM »). Cette exception autorise l’analyse automatisée des textes et des données, protégés ou non par des droits d’auteur, sous une forme numérique, afin d’en dégager des informations telles que des tendances et des corrélations. Cependant, pour le Tribunal, est permise la seule analyse d’informations telles que les règles syntaxiques abstraites, les termes courants et les relations sémantiques. Or, la mémorisation des paroles de chanson va bien au-delà de cette analyse, puisque ces paroles sont intégralement reprises dans les paramètres du modèle.

Dans un second temps, la juridiction allemande constate que les œuvres ont été communiquées au public et mises à sa disposition au sens de l’article 3 de la directive InfoSoc. À l’instar du droit de « reproduction », la directive confère aux auteurs le droit exclusif d’autoriser ou d’interdire toute communication au public de leurs œuvres. Pour arriver à cette conclusion, le Tribunal relève que ChatGPT est en mesure de reproduire le texte ou le refrain des chansons de façon reconnaissable, malgré quelques « hallucinations » du modèle (c’est-à-dire des erreurs ou termes inventés). En outre, il note que les œuvres étaient mises à la disposition du public avec une requête formulée de façon simple par un utilisateur et qu’elles étaient accessibles à un nombre important de personnes, depuis n’importe quel endroit et à n’importe quel moment, à condition de disposer d’un accès à internet.

Enfin, OpenAI faisait valoir qu’elle n’était pas responsable des violations des droits d’auteur étant donné que les réponses du modèle de langage sont provoquées par les utilisateurs eux-mêmes. La juridiction allemande ne lui a pas donné raison considérant que OpenAI, en tant que responsable de l’architecture du modèle, garde le contrôle sur les sorties de celui-ci et est responsable du contenu ayant servi à son entraînement et reproduit lors d’une réponse à un utilisateur.

Eu égard à la reproduction et à la mise à disposition des œuvres qui constituent des exploitations non autorisées de celles-ci, le tribunal de Munich condamne donc la société OpenAI à des dommages-intérêts. Cette décision reste susceptible de faire l’objet d’un appel, mais il est intéressant de noter qu’il s’agit de la première décision en Europe condamnant une société détentrice d’une intelligence artificielle pour violations des droits d’auteur.

Les opinions exprimées par l’auteur sont personnelles et n’engagent pas la Cour de justice de l’Union européenne.

  1. Directive 2001/29/CE du Parlement européen et du Conseil du 22 mai 2001 sur l’harmonisation de certains aspects du droit d’auteur et des droits voisins dans la société de l’information.
  2. Directive (UE) 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant
    les directives 96/9/CE et 2001/29/CE.

Source :

    • Tribunal régional de Munich, n° 42 O 14139/24, 11 novembre 2025.