DeepSeek, il modello di intelligenza artificiale cinese che ha scioccato l'industria tecnologica e sconvolto Wall Street con i suoi costi significativamente bassi e le sue buone prestazioni, presenta "alcune reali innovazioni" ed è "tutta una buona notizia", ha dichiarato Satya Nadella, CEO di Microsoft.
Nadella ha fatto questo commento durante la telefonata sugli utili trimestrali dell'azienda, giovedì, quando ha affermato che l'IA non è in alcun modo diversa dai normali sviluppi informatici. Microsoft ha iniziato a offrire il modello DeepSeek-R1 per l'inferenza, un modello di IA che rivela il suo "processo di pensiero" in modo che gli utenti possano verificarne i risultati. Questo modello è stato reso disponibile agli utenti della piattaforma cloud di Microsoft lo stesso giorno.
Le accuse, nonostante l'uso di
Microsoft, uno dei principali investitori nel concorrente statunitense di DeepSeek, OpenAI, sta anche indagando se uno sviluppatore cinese di IA abbia ottenuto i dati di output di OpenAI in modo non autorizzato.
OpenAI ha informato i media di avere le prove che DeepSeek ha utilizzato il servizio OpenAI per addestrare i suoi modelli di intelligenza artificiale, un comportamento non conforme ai termini di servizio di OpenAI.
Tuttavia, né OpenAI né Microsoft hanno fornito prove.
Mentre l'indagine prosegue, un incaricato dell'amministrazione Trump ha già accusato DeepSeek di aver utilizzato tecnologia statunitense "rubata".
Howard Lutnick, il candidato alla carica di segretario al commercio, ha dichiarato mercoledì in un incontro con i senatori statunitensi che l'amministrazione affronterà la questione.
Nel frattempo, David Sacks, consigliere del presidente Trump per l'intelligenza artificiale, ha affermato che esistono "prove sostanziali" che DeepSeek "ha acquisito conoscenze" dai modelli OpenAI.
"Distillation violerà la maggior parte dei termini di servizio, eppure è ironico - o addirittura ipocrita - che Big Tech lo critichi", ha dichiarato mercoledì Lutz Finger, investitore tecnologico e docente della Cornell University. "Anche la formazione di ChatGPT sui contenuti di Forbes o del New York Times viola i loro termini di servizio".
Che cos'è la "distillazione"?
La distillazione è il processo con cui un nuovo modello di intelligenza artificiale interroga ripetutamente un modello più grande e impara dai suoi risultati.
Questo processo è descritto nei documenti di ricerca pubblici di DeepSeek, ma i ricercatori hanno dichiarato di averlo utilizzato in modo diverso. Secondo l'azienda, hanno usato il modello DeepSeek-R1 per l'inferenza come un "modello più grande" che ha "insegnato" ad altri modelli, come Alibaba Qwen e Meta Llama, a diventare anch'essi capaci di fare inferenza.
I modelli distillati e l'R1 originale sono stati rilasciati per il download gratuito, consentendo alle persone con computer meno potenti o persino smartphone di eseguire i modelli offline con pieno controllo, cosa impossibile per gli utenti di ChatGPT perché il modello alla base del servizio OpenAI è nascosto anche agli utenti paganti.
I post sui social media hanno indicato che DeepSeek a volte si identifica come ChatGPT, il che potrebbe essere una prova del furto di dati. Ma come tutti gli altri modelli di intelligenza artificiale, DeepSeek non dice sempre la verità. Una versione precedente del chatbot Gemini di Google si identificava come il bot Ernie di Baidu quando veniva interrogato in cinese, ma Baidu non ha mai accusato Google di furto di dati.