Ô ChatGPT cela pourrait même plaire à nous, simples internautes. Mais de nombreuses entreprises sont mécontentes de cette nouvelle technologie, au point de bloquer GPTBot, un robot d'OpenAI, créateur de ChatGPT, qui collecte le contenu Web sur tout le Web.
Selon une enquête réalisée par Originality.ai, plus de 15 des 100 sites Web les plus consultés sur Internet ont bloqué le robot. Certains des sites de la liste sont des moteurs de recherche et reçoivent des milliers de visites par jour.
voir plus
Google lance un outil qui améliore les niveaux de sécurité et…
Fini les complications: remplacez le HD par un SSD sans avoir à réinstaller le…
Certains d'entre eux sont:
De manière générale, il s'agit d'un moyen de protéger les droits d'auteur du contenu de ces sites.
Selon un porte-parole de Reuters, « la propriété intellectuelle est l’élément vital de notre entreprise et nous devons protéger les droits d’auteur de notre contenu ». Ce commentaire a été fait à propos d'un article du journal The Guardian.
Il existe également une autre explication: empêcher GPTBot d'utiliser le contenu de ces domaines pour former et développer d'autres Intelligence artificielle.
GPTBot est ce qu'on appelle un « crawler ». En d’autres termes, un robot qui « rampe » sur Internet pour collecter des informations et des données. Il ne s'agit pas d'une nouvelle technologie. Google, Bing et d’autres moteurs de recherche l’ont également utilisé pour indexer les pages et afficher rapidement les résultats.
Cependant, OpenAI souhaite utiliser des robots pour entraîner ses logiciels. Avec ces informations, ils pourraient mettre à jour le ChatGPT et vous rend encore plus pointu et compétent.
GPTBot a été annoncé en août 2023. Conscient des possibles répercussions négatives, OpenAI a également présenté tout le matériel nécessaire pour que les sites web puissent empêcher leur robot de collecter leur contenu.
D'autres robots d'exploration ont également été bloqués sur les sites mentionnés au début de l'article. Parmi eux se trouve CCBot, utilisé pour Common Crawl. Le but de cet outil est de créer des archives publiques à but non lucratif.
En conséquence, on suppose que les droits d’auteur ne sont pas les seuls à être en jeu dans la lutte des entreprises contre l’IA. Une théorie est que les entreprises souhaitent que les utilisateurs accèdent à leur contenu directement depuis la source – en générant un accès et des revenus pour eux, et non le 3ème.
Diplômé en Communication Sociale de l'Université Fédérale de Goiás. Passionné par les médias numériques, la culture pop, la technologie, la politique et la psychanalyse.