Reddit ha bloccato Microsoft dal cercare nel suo sito e dall'utilizzare i dati per addestrare le proprie IA

Microsoft Reddit Il CEO di Reddit, Steve Huffman, ha evidenziato l’abitudine segreta di Microsoft in un colpo di scena nel mondo tecnologico. L’esecutivo ha fatto un’interessante dichiarazione su come Microsoft abbia utilizzato l’ampia raccolta di dati di Reddit per insegnare i propri servizi di intelligenza artificiale senza il consenso di Reddit.

In un’intervista con The Verge, Huffman ha menzionato che Microsoft, Anthropic e Perplexity sono tra le aziende di IA che si sono comportate come se Internet fosse la loro ostrica, utilizzando liberamente contenuti per addestrare la loro IA. Questo è avvenuto dopo che Reddit ha deciso di prendere una posizione forte nel chiedere ai motori di ricerca di pagare se vogliono accedere ai suoi dati—fino ad ora solo Google ha pagato.

Huffman ha usato un’analogia chiara per spiegare quanto sia difficile impedire a queste grandi aziende tecnologiche di accedere ai dati di Reddit. Ha detto che bloccarli sembra come cercare di tenere lontani gli scoiattoli da un mangiatoia per uccelli. Anche se Microsoft ha fornito opzioni per i controlli di crawling da parte dei webmaster, Reddit ha deciso di utilizzare un altro motore di ricerca, che Huffman non ha menzionato.

Nonostante ciò, Reddit ha bloccato Bing dall’esplorare il proprio sito per la ricerca, favorendo un altro motore di ricerca e influenzando la concorrenza di Bing e dei motori alimentati da Bing. — Jordi Ribas (@JordiRib1) 29 luglio 2024

Questa situazione non riguarda solo Reddit e Microsoft. Invece, offre un piccolo sguardo alla discussione più ampia su come le aziende tecnologiche utilizzino i dati pubblici per i loro obiettivi di IA. Il commento del CEO di Microsoft AI, Mustafa Suleyman, secondo cui i dati di Internet sono stati “freeware”, alimenta ulteriori discussioni, implicando una comprensione consolidata che i dati possono essere utilizzati per addestrare intelligenza artificiale.

La posizione di Huffman suggerisce un cambiamento nel modo in cui i creatori di contenuti percepiscono la loro connessione con i motori di ricerca e le aziende di IA. Il vecchio accordo di scambio di dati per traffico sembra stia cambiando. Con l’aumento della fame di dati da parte dell’IA, le condizioni di interazione vengono ridefinite. La decisione di Reddit potrebbe creare un primo caso, motivando ulteriori fornitori di contenuti e prevenendo i crawler dall’accordarsi.

Questa storia in corso di Reddit contro Microsoft è più significativa di un semplice disaccordo drammatico tra due aziende. Rappresenta una questione cruciale dei nostri tempi, mostrando l’intricata connessione tra la privacy dei dati, lo sviluppo dell’intelligenza artificiale e i principi fondamentali su cui si basa Internet.