2 min read

Interdire l’accès de votre site à ChatGPT, c'est bien.

When Computers Were Human
When Computers Were Human by NASA's Marshall Space Flight Center is licensed under CC-BY-NC 2.0

Si vous êtes propriétaire d’un site web, il est important de protéger votre propriété intellectuelle et votre contenu contre ceux qui pourraient l’utiliser de manière abusive. L’un des moyens de protéger votre site est d’interdire l’accès à des bots et des crawlers indésirables tels que ChatGPT.

Oui, c’est sévère, mais c’est vraiment pas mal du tout au final.

Pourquoi ?

Parce que ChatGPT est « juste » un chatbot intelligent qui utilise des algorithmes d’apprentissage automatique pour répondre aux questions des utilisateurs.

Le terme « juste » est un peu réducteur, mais bon. Le vrai danger, c’est que ChatGPT peut être utilisé pour copier et distribuer votre contenu sans votre autorisation. Et là, ça craint un peu.

Pas de grande solution, simplement la bonne vieille méthode habituelle qui marche (si le robot n’est pas un sans gêne) : en utilisant le fichier robot.txt.

En interdisant l’accès de votre site à ChatGPT, vous pouvez protéger votre propriété intellectuelle et votre contenu contre les utilisations non autorisées. Pour interdire l’accès à ChatGPT, vous pouvez mettre en place des règles dans votre fichier robots.txt. Vous pouvez également utiliser des outils de blocage d’IP pour empêcher l’accès à votre site à partir des adresses IP utilisées par ChatGPT. Mais là, c’est au cas où vous commencez à avoir des doutes sur l’éthique de ChatGPT (j’en ai un peu, j’avoue).

Bref, on fait comment ?

Comme ça :

User-agent: ChatGPT-User
Disallow: /

La documentation officielle si jamais vous la voulez, elle est là : https://platform.openai.com/docs/plugins/bot

Pour le fichier robots.txt, Google a fait un article à ce sujet : https://developers.google.com/search/docs/advanced/robots/submit-updated-robots-txt?hl=fr

Beaucoup d’occurence de « ChatGPT » dans cet article …


Quelques précisions suite à mon partage sur LinkedIn par Joseph Campel :

👍

Voici donc les instructions à reprendre si vous le souhaitez :

User-agent: CCBot
Disallow: /
Pour bloquer le "crawler" d'OpenAI et éviter que vos contenus n'entrent dans le dataset d’apprentissage de leur IA.

User-agent: ChatGPT-User
Disallow: /