Reddit hat Microsoft daran gehindert, seine Seite zu durchsuchen und die Daten zur Schulung ihrer KI zu verwenden

Microsoft Reddit Der CEO von Reddit, Steve Huffman, hob Microsofts geheime Gewohnheit in einer Wendung der Technologiewelt hervor. Der Geschäftsführer machte eine interessante Aussage darüber, wie Microsoft die umfangreiche Datensammlung von Reddit verwendet hat, um seine KI-Dienste ohne das Wissen von Reddit zu schulen.

In einem Interview mit The Verge erwähnte Huffman, dass Microsoft, Anthropic und Perplexity zu den KI-Unternehmen gehören, die so handeln, als wäre das Internet ihre eigene Muschel, indem sie Inhalte frei zur Schulung ihrer KI nutzen. Dies geschah, nachdem Reddit beschlossen hatte, eine klare Position einzunehmen und von Suchmaschinen zu verlangen, für den Zugriff auf seine Daten zu bezahlen—bis jetzt hat nur Google gezahlt.

Huffman benutzte eine klare Analogie, um zu erklären, wie schwierig es ist, diese großen Tech-Unternehmen daran zu hindern, auf die Daten von Reddit zuzugreifen. Er sagte, das Blockieren dieser Unternehmen fühle sich an, als wollte man Eichhörnchen von einem Vogelhaus fernhalten. Obwohl Microsoft Optionen für Webmaster-Crawling-Kontrollen bereitstellte, entschied sich Reddit, eine andere Suchmaschine zu nutzen, die Huffman nicht erwähnte.

Trotz dessen hat Reddit Bing das Crawlen ihrer Seite zur Suche untersagt und eine andere Suchmaschine bevorzugt, was die Konkurrenz von Bing und Bing-unterstützten Engines beeinträchtigt. — Jordi Ribas (@JordiRib1) 29. Juli 2024

Diese Situation betrifft nicht nur Reddit und Microsoft. Vielmehr bietet sie einen kleinen Einblick in die breitere Diskussion darüber, wie Tech-Unternehmen öffentliche Daten für ihre KI-Ziele nutzen. Die Aussage von Microsoft AI CEO Mustafa Suleyman, dass Internetdaten “Freeware” seien, schürt weitere Diskussionen und impliziert ein seit langem bestehendes Verständnis, dass Daten zur Schulung künstlicher Intelligenz verwendet werden können.

Huffmans Stellungnahme deutet darauf hin, dass sich die Wahrnehmung der Inhaltsanbieter in Bezug auf ihre Verbindung zu Suchmaschinen und KI-Unternehmen ändern könnte. Die alte Vereinbarung, Daten gegen Traffic auszutauschen, scheint sich zu verändern. Während der Hunger nach Daten für KI zunimmt, werden die Bedingungen für die Interaktion neu definiert. Die Entscheidung von Reddit könnte einen ersten Fall schaffen, der zusätzliche Inhaltsanbieter motiviert und das Einverständnis von Crawlers verhindert.

Diese laufende Geschichte von Reddit gegen Microsoft ist bedeutender als nur ein dramatischer Streit zwischen zwei Unternehmen. Sie stellt eine wesentliche Angelegenheit unserer Zeit dar, die die komplexe Verbindung zwischen Datenschutz, Entwicklung künstlicher Intelligenz und den Grundprinzipien, auf denen das Internet funktioniert, aufzeigt.