
Qual è l'impatto reale di DeepSeek sull'IA e quali sono le implicazioni per gli investitori
Nelle ultime settimane sono circolate molte voci sul potenziale impatto di DeepSeek, un modello di intelligenza artificiale (IA) cinese, sull’ecosistema dell’IA. Ciò ha provocato movimenti significativi dei prezzi delle azioni. Tuttavia, riteniamo che queste narrazioni su DeepSeek poggino su elementi infondati. Ecco perché:
Il clamore e la realtà
Le recenti notizie su DeepSeek hanno acceso un intenso dibattito nel mondo degli investimenti, in particolare circa la possibilità che il modello cinese segnali la fine del dominio degli Stati Uniti nel campo dell’IA e che ciò possa portare a una drastica riduzione della domanda di infrastrutture per l’IA. Riteniamo che gran parte di questa analisi sia sbagliata o, quantomeno, che si concentri sugli aspetti sbagliati. Le questioni che riguardano DeepSeek sono molto tecniche e richiedono una comprensione approfondita sia della tecnologia che delle strategie aziendali legate all’IA.
Uno dei principali motivi del contendere è il costo dell’addestramento del modello di DeepSeek. Sembrerebbe che addestrare l’ultimo modello linguistico di grandi dimensioni (LLM) di DeepSeek su un numero relativamente ridotto di unità di elaborazione grafica (GPU) costerebbe appena 6 milioni di dollari, a fronte di prestazioni equiparabili a quelle di leader del settore come GPT-4 di OpenAI e Claude di Anthropic.
Tuttavia, riteniamo che questa cifra non colga appieno l’entità dei costi. Ad esempio, tale dato non tiene conto del costo legato all’assunzione dei migliori ricercatori nel campo dell’IA né del valore della ricerca accumulata nei principali laboratori di IA. È possibile inoltre che DeepSeek abbia sottostimato il numero – e dunque il costo totale – delle GPU utilizzate nel processo. Per usare una metafora, sarebbe come affermare di aver costruito un’auto spendendo 1.000 dollari senza contare i costi associati alla fabbrica, agli ingegneri e a decenni di ricerca automobilistica.
La vera innovazione: i modelli di ragionamento
Sebbene l’attenzione si sia concentrata sul costo dell’addestramento, la vera innovazione risiede nel modello di ragionamento di DeepSeek, detto R1. I modelli di ragionamento sono sistemi di IA in grado di suddividere problemi complessi in più fasi e rappresentano un passo avanti rispetto ai tradizionali prompt degli LLM. DeepSeek sembra aver dimostrato che creare modelli di ragionamento è meno difficile o costoso di quanto si pensava in precedenza. Ma se da un lato costruire un modello di ragionamento non è poi così difficile, è essenziale che questo funzioni con un elevato grado di precisione, e le prestazioni di DeepSeek non sembrano attualmente all’altezza di quelle di OpenAI o di Google. Sembra inoltre che il modello R1 di DeepSeek produca molte più risposte inventate rispetto agli equivalenti modelli di ragionamento e open source.1
Più in generale, per gli investitori si tratta di un’innovazione significativa perché lascia intravedere un futuro in cui i modelli di ragionamento potrebbero diventare sempre più disponibili e comuni, alimentando la domanda di infrastrutture per l’IA. Questo perché i modelli di ragionamento, pur essendo per certi versi più efficienti, richiedono una potenza di calcolo significativamente maggiore rispetto ai modelli IA di base. Inoltre, all’aumentare della convenienza e delle capacità dell’IA, i tassi di utilizzo tendono a crescere notevolmente. Le aziende stanno trovando modi nuovi di utilizzare l’IA che richiedono più potenza di calcolo, non meno. Ciò ripercorre uno schema che gli economisti chiamano “paradosso di Jevons”: quando la tecnologia diventa più efficiente, spesso il suo utilizzo aumenta.
Saranno la qualità e le prestazioni, non i costi, a guidare l'adozione dell'IA
Per comprendere fino in fondo le implicazioni di DeepSeek, dobbiamo considerare sia la qualità che le prestazioni dei modelli di IA. La narrazione intorno a DeepSeek si è concentrata molto sui costi, ma il vero motore dell’adozione dell’IA è il miglioramento della qualità e delle prestazioni. Man mano che i modelli di IA diventeranno sempre più capaci ed efficienti, verranno utilizzati in una gamma più ampia di applicazioni, promuovendo la domanda di infrastrutture per l’IA.
I modelli di ragionamento rappresentano un notevole balzo in avanti nelle capacità dell’IA. Questi modelli sono non solo più accurati ma anche più versatili, in grado di gestire compiti complessi che gli LLM standard non riescono a svolgere. Dal punto di vista della spesa in conto capitale, questo potenziamento della capacità accresce il fabbisogno di investimenti nelle infrastrutture per l’IA. Segnatamente, i modelli di ragionamento hanno una maggiore intensità di calcolo e richiedono, tra le altre cose, più hardware IA, più meccanismi di raffreddamento e più energia.
La concorrenza fa scendere i prezzi dei modelli di IA, ma la qualità conta
Qualità e prezzo a confronto

Fonte: Analisi al 10 febbraio 2025. Indice della qualità delle analisi artificiali: risultato medio delle nostre valutazioni relative a diversi parametri di intelligenza del modello. Attualmente comprende MMLU, GPQA, Math e Human Eval. I dati riguardanti il modello OpenAI o1 sono preliminari e si basano su quelli dichiarati da OpenAI. Prezzo per token, espresso in USD per milione di token. Il prezzo è composto da una combinazione dei prezzi dei token di input e di output (rapporto 3:1).
Tuttavia, la discussione intorno a DeepSeek solleva un interrogativo ben preciso: lo sviluppo di modelli di IA è di per sé un “buon affare”? Aziende come Meta e DeepSeek sono disposte a rendere open source – ossia a “regalare” – i loro modelli di IA perché guadagnano in altri modi. Ma le principali società tecnologiche non hanno intenzione di ridimensionare i propri investimenti nell’IA a causa di DeepSeek. Questo perché l’IA è ritenuta una tecnologia trasformativa destinata a penetrare praticamente in ogni settore dell’economia, dall’assistenza sanitaria alla scoperta di farmaci, dall’industria automobilistica ai servizi finanziari. Per le aziende tecnologiche gli investimenti attuali sono indispensabili per cogliere queste opportunità future. Per fare un’analogia, anche se spesso le compagnie aeree faticano a realizzare utili, ciò non impedisce ai produttori di aeroplani e agli operatori aeroportuali di portare avanti attività redditizie.
Conclusioni
Il modo migliore di inquadrare DeepSeek è ritenerlo una fra le tante innovazioni che stanno velocemente migliorando le prestazioni e riducendo i costi dell’IA. Gran parte di queste innovazioni passa inosservata agli occhi degli investitori e del grande pubblico. DeepSeek è stato notato e ha scatenato un’intensa reazione sui mercati. Tuttavia, nel contesto degli sviluppi dell’IA, dobbiamo vederlo come parte di un’evoluzione. Considerando una prospettiva più ampia, il vero tema è migliorare la capacità e l’accessibilità dell’IA, il che storicamente si traduce in una maggiore domanda di potenza di calcolo. Pertanto, riteniamo che il più ampio ecosistema delle infrastrutture per l’IA sia ben posizionato per la crescita. Questi momenti di incertezza possono offrire opportunità agli investitori con un orizzonte di lungo termine, soprattutto a quelli che mantengono un approccio diversificato all’esposizione verso l’IA.