Quel est l’impact réel de DeepSeek sur l’IA et quelles sont les conséquences pour les investisseurs ?
L’impact potentiel du modèle d’intelligence artificielle (IA) chinois DeepSeek sur l’écosystème d’IA a fait l’objet de nombreuses spéculations ces dernières semaines, engendrant d’importantes fluctuations du cours des actions. Nous pensons toutefois que certains éléments clés de l’argumentaire lié à DeepSeek sont erronés. Voici pourquoi :
Battage médiatique et réalité
Les récentes unes des journaux concernant DeepSeek ont suscité un vif débat au sein de la communauté des investisseurs, concernant surtout l’idée selon laquelle l’émergence de ce nouvel outil pourrait mettre un terme à la prédominance des États-Unis dans le domaine de l’IA et réduire considérablement la demande en infrastructures d’IA. Il nous semble que cet argument est en grande partie infondé ou, du moins, qu’il se concentre sur les mauvais aspects. Les questions relatives à DeepSeek sont profondément techniques et nécessitent une compréhension nuancée à la fois de la technologie d’IA et de la stratégie d’entreprise.
L’un des principaux points de désaccord concerne le coût de développement de DeepSeek. Selon ses créateurs, 6 millions USD auraient suffi en effet à développer le dernier grand modèle de langage (LLM) de DeepSeek, sur un nombre relativement restreint d’unités de traitement graphique (GPU), pour lui permettre d’égaler les performances des leaders du secteur tels que GPT-4 d’OpenAI ou encore Claude d’Anthropic.
Nous pensons toutefois que ce chiffre ne reflète pas toute l’étendue des coûts supportés. Par exemple, il n’intègre pas ceux liés à l’emploi des meilleurs chercheurs en intelligence artificielle ni les coûts d’exploitation des recherches existantes effectuées par les principaux laboratoires d’IA. DeepSeek pourrait également avoir sous-estimé le nombre – et donc le coût total – des GPU utilisés dans le processus. Cela revient à dire que l’on a construit une voiture pour 1.000 dollars, sans tenir compte du coût de l’usine, des ingénieurs et des dizaines d’années de recherche dans le secteur automobile.
La véritable innovation : les modèles de raisonnement
Bien que l’accent ait été mis principalement sur le coût de l’entraînement, la véritable innovation réside dans le modèle de raisonnement de DeepSeek, R1. Les modèles de raisonnement sont des systèmes d’intelligence artificielle capables de décomposer des problèmes complexes en plusieurs étapes, ce qui constitue une avancée par rapport aux LLM standards. DeepSeek semble avoir démontré que la création de modèles de raisonnement est moins compliquée ou onéreuse qu’on le pensait. Si l’élaboration d’un modèle de raisonnement n’est pas aussi difficile que prévu, il est toutefois important qu’il fonctionne avec une grande précision – et les performances de DeepSeek ne sont apparemment pas à la hauteur de celles d’OpenAI ou de Google actuellement. Le modèle R1 de DeepSeek semble également fournir ses réponses beaucoup plus rapidement que les modèles de raisonnement et en open-source comparables.1
Plus généralement, cette innovation est importante du point de vue de l’investissement, car elle suggère que la disponibilité et la diffusion des modèles de raisonnement pourraient augmenter, ce qui entraînerait une hausse de la demande en infrastructures d’IA. En effet, les modèles de raisonnement, bien que plus efficaces à certains égards, nécessitent une puissance de calcul nettement supérieure à celle des modèles d’IA de base. En outre, à mesure que l’IA devient moins onéreuse et plus performante, son utilisation tend à augmenter de manière spectaculaire. Les entreprises trouvent de nouvelles façons de l’implémenter qui sont plus, et non moins, gourmandes en puissance de calcul. Cette évolution suit un schéma que les économistes appellent le « Paradoxe de Jevons », qui stipule que le recours à une technologie augmente à mesure que celle-ci devient plus efficace.
L’adoption de l’IA sera déterminée par sa qualité et sa performance, et non par son coût
Pour bien comprendre les implications de DeepSeek, il faut tenir compte à la fois de la qualité et de la performance des modèles d’IA. Si les discussions entourant DeepSeek se sont essentiellement focalisées sur les coûts, le véritable moteur de l’adoption de l’IA est l’amélioration de la qualité et de la performance. Au fur et à mesure que les modèles d’IA gagnent en performance et en efficacité, ils seront utilisés dans un plus grand nombre d’applications, ce qui stimulera la demande en infrastructures d’IA.
Les modèles de raisonnement représentent une avancée majeure dans les capacités d’IA. Ils sont non seulement plus précis, mais aussi plus polyvalents, capables de gérer des tâches complexes hors de portée des modèles LLM standards. Cette capacité accrue entraîne une hausse des dépenses d’investissement requises dans les infrastructures d’IA. Plus précisément, les modèles de raisonnement sont plus gourmands en ressources informatiques, ce qui nécessite davantage de matériel d’IA ou d’installations de refroidissement et d’énergie, entre autres.
La qualité revêt une grande importance alors que la concurrence fait baisser le prix des modèles d'IA
Qualité vs prix
Source : Analyse, au 10 février 2025. Indice de qualité de l’analyse artificielle : résultat moyen de nos évaluations couvrant différentes dimensions de l’intelligence du modèle. Inclut actuellement les tests MMLU, GPQA, Math & Human Eval. Les chiffres du modèle OpenAI o1 sont préliminaires et basés sur ceux déclarés par OpenAI. Prix par jeton, en USD par million de jetons. Le prix comprend les prix des jetons d’entrée et de sortie (rapport 3:1).
Toutefois, le débat sur DeepSeek soulève la question de savoir si le développement de modèles d’IA est en soi une « bonne affaire ». Des entreprises comme Meta et DeepSeek sont prêtes à fournir leurs modèles d’IA en open-source, c’est-à-dire à les « donner », parce qu’elles disposent d’autres sources de revenus. En revanche, les grandes entreprises technologiques ne prévoient pas de réduire leurs investissements dans l’IA en réponse à l’arrivée de DeepSeek. En effet, l’IA est considérée comme une technologie transformatrice qui pénétrera pratiquement tous les secteurs de l’économie, de la santé au développement de médicaments en passant par l’automobile et les services financiers. Les entreprises technologiques considèrent dès lors que les investissements actuels sont nécessaires pour saisir ces opportunités futures. La situation est similaire à celle des compagnies aériennes, qui peinent souvent à faire des bénéfices alors que les constructeurs d’avions et les exploitants d’aéroports sont toujours rentables.
Conclusion
La meilleure façon de comprendre DeepSeek est de l’envisager comme une innovation parmi beaucoup d’autres qui améliorent rapidement les performances de l’IA tout en réduisant son coût. Contrairement à la plupart de ces innovations, qui passent inaperçues aux yeux des investisseurs et du grand public, DeepSeek a été remarqué, suscitant une vive réaction du marché. Dans le contexte du développement de l’IA, nous devrions cependant envisager ce modèle comme une simple évolution. Si l’on prend un peu de recul, ce qui importe réellement c’est de rendre l’IA plus performante et plus accessible, ce qui se traduit historiquement par une augmentation de la demande de puissance de calcul. Nous pensons dès lors que l’écosystème plus large de l’infrastructure d’IA est toujours appelé à croître. Pour les investisseurs à long terme, ces périodes d’incertitude sont susceptibles de créer des opportunités, notamment en maintenant une exposition à l’IA diversifiée.