Le code comme œuvre littéraire
Après de longues discussions dans les années 1970 et 1980, en 1991, dans l’UE et 1994 au niveau de l’OMCle statut juridique des programmes informatiques était une question réglée : les logiciels devaient être traités au titre du droit d’auteur comme une œuvre littéraire.
Le code source et le code objet sont protégés par le droit d’auteur. Comme établi dans l’affaire fondamentale C-406/10, SAS: « …le code source et le code objet d’un programme d’ordinateur sont des formes d’expression de celui-ci qui, par conséquent, peuvent être protégés par le droit d’auteur au même titre que les programmes d’ordinateur, en vertu de l’article 1er, paragraphe 2, de la directive 91/250.» (§38) et «ni la fonctionnalité d’un programme informatique ni le langage de programmation et le format des fichiers de données utilisés dans un programme informatique pour exploiter certaines de ses fonctions ne constituent une forme d’expression de ce programme au sens de l’article 1er, paragraphe 2, de la directive 91. /250.» (§39).
Résultats générés par l’IA et rôle des invites
Dans les années 2020, nous sommes à nouveau confrontés à une épineuse question autour de l’informatique et du droit d’auteur : quel est le statut juridique des créations d’IA ?
Il existe une distinction importante à faire entre les résultats assistés par l’IA et ceux créés par l’IA. Utiliser les mots de l’OMPI:
« Généré par l’IA et « généré de manière autonome par l’IA » sont des termes utilisés de manière interchangeable et font référence à la génération d’un résultat par l’IA sans intervention humaine. Dans ce scénario, l’IA peut modifier son comportement pendant le fonctionnement pour répondre à des informations ou à des événements imprévus. Ceci doit être distingué des résultats « assistés par l’IA » qui sont générés avec une intervention et/ou une direction humaine matérielle..
Il semble clair que la production assistée par l’IA peut être protégée par le droit d’auteur (voir par exemple Hugenholtz&Quintais).
Cependant, même avec les œuvres créées par l’IA, les machines ne créent pas de leur propre gré. L’allumage ou l’entrée initiale provient d’un humain. Les instructions permettant à l’ordinateur d’exécuter une fonction, telle que la génération de texte, d’image, de vidéo ou de code, ne sont pas données dans un langage de programmation formel traditionnel tel que Python, Java ou C. Au lieu de cela, les utilisateurs « contrôlent » désormais l’ordinateur à l’aide de langage naturel, ce qu’on appelle les « invites ». L’ingénierie d’invite est définie dans le livre Stable Diffusion Prompt comme « le processus de structuration de mots qui peuvent être interprétés et compris par un modèle texte-image. Considérez-le comme le langage que vous devez parler pour dire à un modèle d’IA quoi dessiner.»
Les invites sont-elles du code ?
Toutes les invites ne sont pas identiques. Certaines sont des questions simples et ressemblent à une requête typique dans un moteur de recherche (« Quelle est la capitale du Myanmar ? »), d’autres sont très simples (« Un chat boit un cocktail » – ici), tandis qu’un sous-ensemble est particulièrement complexe. Par exemple, invite n°91 : «Illustration chinoise sur fond bleu, nuages de bon augure, 16k, 3d, pastel, ruisseau de ravin, bateau, pin, chaîne de montagnes, nombreuses maisons, nombreux bâtiments anciens, quilling de papier multidimensionnel, composition de tunnel, lumière chaude, UHD, perspective d’élévation, ultra-réaliste, couleur Morandi, détails exquis, vue étendue, détails épiques » a généré l’image que vous pouvez voir ici. Les utilisateurs peuvent également ajouter des chiffres, certains mots et caractères (appelés paramètres) pour mieux contrôler le résultat du processus de génération.
Certaines des invites les plus complexes pourraient probablement être protégées en tant que texte littéraire « normal », mais il est également vrai qu’il s’agit d’instructions destinées à un système d’IA générative, c’est-à-dire un ordinateur, pour exécuter une fonction. Les invites avancées impliquent souvent une syntaxe, des paramètres et même des opérateurs logiques spécifiques pour affiner la sortie de l’IA. Cette approche structurée reflète la logique et l’organisation des langages de programmation traditionnels.
Il est vrai que lorsqu’on fait référence au code, la directive sur les programmes informatiques pensait à un langage de programmation « classique », c’est-à-dire un système de notation utilisant des règles formelles pour fournir des instructions aux ordinateurs. Cependant, y a-t-il un obstacle à considérer ces invites comme un langage de programmation ? Après tout, le considérant 7 de la directive européenne stipule que « les programmes informatiques doivent inclure des programmes sous quelque forme que ce soity compris ceux qui sont intégrés au matériel. Le choix de ne pas définir les programmes informatiques visait précisément à pérenniser la loi.
Au niveau européen, il n’existe pas de définition d’un programme informatique. Loi américaine sur le droit d’auteur le définit comme «un ensemble d’instructions ou d’instructions à utiliser directement ou indirectement dans un ordinateur afin d’obtenir un certain résultat.» Pour citer un ouvrage classique d’ingénierie: « Les processus informatiques sont des êtres abstraits qui habitent les ordinateurs. À mesure qu’ils évoluent, les processus manipulent d’autres éléments abstraits appelés données. L’évolution d’un processus est dirigée par un ensemble de règles appelé programme. Les gens créent des programmes pour diriger les processus. En effet, nous invoquons les esprits de l’ordinateur avec nos sorts.» Les invites semblent être ce genre de sorts.
Objections possibles
Le code traditionnel est déterministe ; le code se comportera toujours de la même manière – pour la même entrée, on peut s’attendre à recevoir la même sortie. Cela génère certains défis en soi pour la protection du droit d’auteur sur les logiciels, étant donné que, comme la Cour l’a dit dans l’affaire C-393/09, BSA§49 : « …lorsque l’expression de ces composants est dictée par leur fonction technique, le critère d’originalité n’est pas rempli, puisque les différentes modalités de mise en œuvre d’une idée sont si limitées que l’idée et l’expression deviennent indissociables..»
En vertu du droit d’auteur sur les logiciels, le code compilé (alias « code machine » ou « code objet »), c’est-à-dire les instructions électriques lues par les processeurs, est protégé en tant que changement de format par rapport au code source, le texte qui a été réellement écrit par programmeurs humains.
Ce n’est pas le cas des invites. La même invite adressée au même modèle ne fournira pas les mêmes résultats.
Il est vrai que pour que le droit d’auteur naisse, il n’est pas nécessaire d’avoir un contrôle absolu sur le résultat. Le caractère aléatoire est autorisé s’il existe encore un certain degré de contrôle humain ou de lien avec le résultat. Il est clair que le résultat d’un modèle de génération de texte ou d’image est plus qu’un changement de format de l’invite.
Serait-il néanmoins possible de considérer l’invite comme un programme informatique mais de rejeter la classification du résultat comme programme compilé ? La directive sur les programmes informatiques protège «travaux préparatoires de conception conduisant au développement d’un programme informatique, à condition que la nature des travaux préparatoires soit telle qu’un programme informatique puisse en résulter à un stade ultérieur» (considérant 7). Ainsi, protéger les invites en tant que logiciel n’implique pas nécessairement que la sortie soit même protégée par le droit d’auteur.
Cela ne veut pas dire que les invites doivent être considérées comme un travail de conception préparatoire. Tel que jugé par la Cour suprême des Pays-Bas en 2018la différence entre les œuvres littéraires normales et le travail de conception préparatoire réside dans la quantité de travail requise pour parvenir à un programme informatique. S’il y a une autre phase de programmation nécessitant des choix créatifs, il n’y a pas encore de travail de conception préparatoire.
On pourrait choisir de considérer les invites comme des œuvres littéraires normales plutôt que comme des logiciels. Cependant, la différence est pertinente. Les règles applicables, notamment en termes de propriété, de contrats, d’exceptions et de limitations, ne sont pas les mêmes.
Conclusion
Il y a un an, Matt Welsh donnait une conférence et a proposé « l’ordinateur en langage naturel » (voir ici), dans lequel le logiciel serait exprimé en langage naturel. C’est déjà en partie le cas. La programmation et le développement, en particulier les tâches de génération, d’amélioration et de test de code, sont de plus en plus effectués avec l’aide et le support de grands modèles de langage, avec un impact pertinent. Le langage naturel devrait devenir le moyen standard par lequel les utilisateurs professionnels et les consommateurs interagissent avec les ordinateurs et les amènent à effectuer des tâches. Dans une certaine mesure, il remplacera les langages de programmation.
En tant que tribunal américain dis-le : «Appliquer la loi sur le droit d’auteur à des programmes informatiques revient à assembler un puzzle dont les pièces ne s’emboîtent pas parfaitement.« Il y a environ 30 ans, nous assimilions ce « langage étrange » du logiciel (le code source) au langage humain et au logiciel protégé en tant qu’œuvre littéraire. À mesure que la technologie se développe et que les suggestions deviennent plus pertinentes, il se peut que ce soit un choix prémonitoire. Le défi, au moins au niveau européen, est d’avoir des règles différentes en matière de droit d’auteur sur les logiciels et de droit d’auteur « normal ».