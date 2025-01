Secondo l'azienda americana, l'AI cinese sarebbe stata addestrata con ChatGPT tramite una pratica che viola la proprietà intellettuale

DeepSeek avrebbe addestrato il suo modello di intelligenza artificiale sui dati di OpenAI. Questa l’accusa della casa madre di ChatGPT, corroborata dalla Casa Bianca, contro la start up cinese che in questa settimana ha stravolto i mercati introducendo un modello concorrente, low cost ma ad altissima efficienza. Secondo quanto scrive Bloomberg, l’azienda americana avrebbe trovato «prove concrete di distillazione» da parte di utenti riconducibili a DeepSeek, una pratica che consisterebbe in una violazione della proprietà intellettuale di OpenAI.

Cos’è la «distillazione» dei modelli

La «distillazione» è una pratica comune tra gli sviluppatori. Consiste nell’appoggiarsi su modelli grandi ed efficienti per ottenere migliori prestazioni su AI più piccole. Per dirla con David Sacks, “zar” dell’intelligenza artificiale nominato da Donald Trump, è «quando un modello impara da un altro modello e in un certo senso succhia la conoscenza dal modello madre». La distillazione di per sé non è illegale. Anzi lo stesso ChatGPT lo consente tramite l’Api, l’interfaccia di programmazione a cui chiunque può accedere dietro a un pagamento acquistando così la possibilità di integrare i modelli del chatbot nella propria applicazione. La stessa azienda americana nei suoi termini di servizio, infatti, specifica che gli utenti non possono «copiare o utilizzare l’output per sviluppare modelli concorrenti». E proprio questo è il punto che secondo OpenAI e il suo partner tecnologico Microsoft avrebbe fatto DeepSeek.

Le accuse e i dubbi su DeepSeek

Secondo Sacks ci sarebbero «prove sostanziali che ciò che DeepSeek ha fatto in questo caso è stato distillare la conoscenza dai modelli di OpenAI», ha detto in un’intervista al canale Fox News. Secondo alcuni esperti sarebbe chiara la traccia di ChatGPT-4 in alcune risposte che il chatbot concorrente fornisce. La stessa big tech di Sam Altman ha detto di aver rilevato, negli scorsi mesi, la presenza di persone che esfiltravano una grande quantità di dati usando l’Api di OpenAI. Se fosse davvero così, la pratica della distillazione spiegherebbe come il modello V3 sia così poco costoso per l’azienda cinese. DeepSeek, infatti, ha dichiarato di aver usato poco più di 2mila schede grafiche Nvidia H800 e di aver investito meno di 6 milioni di dollari per addestrare il modello V3 con 671 miliardi di parametri. Spese di molto inferiori rispetto a quanto è stato sborsato da OpenAI e Microsoft per sviluppare modelli di dimensioni assolutamente comparabili a quello cinese. La distillazione, quindi, avrebbe permesso a DeepSeek di risparmiare sul capitale umano, che invece gli americani hanno dovuto utilizzare per addestrare il chatbot a fornire risposte “più umane”.

Altman chiama Trump in aiuto

Al netto delle accuse, è evidente che con l’ingresso nel mercato di DeepSeek anche l’intelligenza artificiale è diventata terreno di scontro tra Washington e Pechino. E anche in questo senso la recente vicinanza tra il ceo di OpenAI, Sam Altman, e il presidente americano Donald Trump sembra cascare a pennello. «Crediamo – ha scritto in una nota l’azienda californiana – che sia di fondamentale importanza lavorare a stretto contatto con il governo degli Stati Uniti per proteggere al meglio i modelli più validi dagli sforzi di avversari e concorrenti».