Perché si parla tanto di DeepSeek? L'IA cambia con modelli a basso costo e codici aperti

Una giovane impresa con base in Cina, che si concentra sull’intelligenza artificiale, sta attirando sempre più curiosità grazie a un’impostazione tecnologica peculiare e a costi decisamente abbordabili. Si tratta di DeepSeek, fondata nel 2023 da Liang Wenfeng, un professionista che proviene dal settore degli hedge fund e dal campo dell’AI.

INDICE

Tecnologie e modelli di DeepSeek
Le differenze rispetto ai concorrenti
I possibili ostacoli e gli scenari futuri

L’azienda sta emergendo per la volontà di condividere i propri modelli con la comunità, offrendo soluzioni che hanno già suscitato reazioni significative tra i giganti americani del settore, come OpenAI, Google e Meta. Ma quali sono le linee di sviluppo di DeepSeek, i motivi che la differenziano dalle realtà più note e i possibili ostacoli che dovrà affrontare?

Tecnologie e modelli di DeepSeek

Fin dalla sua fondazione, la società ha cercato di proporsi come rivale di grandi colossi, puntando su progetti capaci di ridurre la richiesta di risorse hardware pur mantenendo capacità avanzate. A novembre 2023 ha introdotto DeepSeek Coder, un modello reso disponibile in modo aperto per assistere i programmatori.

Nei mesi successivi è comparso DeepSeek LLM, con ben 67 miliardi di parametri, affiancato da DeepSeek-V2, lanciato a maggio 2024, in grado di offrire prestazioni elevate a un costo nettamente inferiore rispetto ai suoi principali rivali.

Una delle tecniche adottate prevede l’uso di algoritmi di apprendimento per rinforzo, grazie ai quali i modelli riescono a migliorarsi in modo graduale attraverso l’esecuzione di tentativi successivi. Inoltre, l’architettura Mixture of Experts (MoE) contribuisce a contenere il carico computazionale, poiché il sistema impiega solo una parte dei parametri a seconda del compito da svolgere.

Lo stesso DeepSeek-V3 ha integrato l’attenzione latente multi-testa, capace di analizzare grandi quantità di dati e di elaborare diversi elementi di un input nello stesso momento.

Nel gennaio 2025, la startup ha introdotto DeepSeek-R1, orientato al ragionamento complesso e ritenuto un concorrente diretto delle soluzioni più evolute di OpenAI. Sono stati inoltre realizzati altri modelli, tra cui DeepSeek-R1-Distill, ideati per combinare doti avanzate con dimensioni più ridotte, così da offrire modelli performanti senza gravare eccessivamente sulle risorse.

Le differenze rispetto ai concorrenti

L’azienda si distingue anche per la struttura finanziaria, poiché è sostenuta unicamente da High-Flyer, hedge fund istituito da Liang Wenfeng, e non cerca fondi esterni. Questa indipendenza consente di privilegiare la ricerca a lungo termine, rinviando l’idea di una distribuzione su larga scala.

A fare la differenza è pure la politica dei prezzi, caratterizzata da un costo inferiore di utilizzo delle API rispetto a gran parte degli attori presenti sul mercato. Un esempio lampante è DeepSeek-R1, che viene offerto a 0,55 dollari per milione di token in ingresso e 2,19 dollari per milione di token in uscita, a fronte di tariffe sensibilmente più alte proposte da altre realtà.

Il risultato è una soluzione accessibile, molto interessante soprattutto per le piccole e medie imprese desiderose di adottare sistemi basati sull’intelligenza artificiale.

Inoltre, la scelta di rendere disponibili i modelli in forma aperta fornisce una chance concreta a sviluppatori e aziende di dimensioni ridotte, che possono evitare costi esorbitanti e implementare algoritmi IA all’avanguardia sfruttando le risorse di DeepSeek.

I possibili ostacoli e gli scenari futuri

Nonostante le ottime prospettive, l’impresa deve superare alcune difficoltà. Una delle più rilevanti è la limitata disponibilità di chip di fascia alta a causa dei limiti all’esportazione statunitense, fenomeno che si potrebbe aggravare in caso di modifiche politiche legate all’amministrazione di Donald Trump. Pur essendo in grado di ottimizzare i propri sistemi, la società rimane condizionata dalla necessità di accedere a infrastrutture di calcolo di qualità.

Oltre a ciò, il controllo dei contenuti da parte delle autorità cinesi impone restrizioni all’uso dei modelli, specialmente per evitare che informazioni ritenute contrarie possano circolare liberamente. Questo aspetto potrebbe complicare l’adozione delle soluzioni di DeepSeek in nazioni che prestano particolare attenzione alla tutela della libertà di espressione. Rimane da vedere come l’azienda saprà gestire queste problematiche, dovendo bilanciare le richieste del mercato globale con le normative vigenti nel proprio Paese.