DeepSeek continua a seminare il panico tra le Big Tech di Wall Street
accelerando sul nuovo modello di intelligenza artificiale. Dopo aver lanciato il modello R1, la startup cinese è pronta a rilasciare il suo successore, R2, "il prima possibile", hanno riferito i ben informati. L'azienda con sede a Hangzhou aveva pianificato l'introduzione di R2 all'inizio del mese di maggio, ma ora vuole accorciare i tempi. Quindi, è da aspettarsi un'attesa non troppo lunga, sebbene non ci siano dettagli in merito.
Il nuovo modello comunque dovrebbe produrre una codifica migliore e ragionare in lingue diverse dall'inglese. Soprattutto, R2 mantiene lo standard di costi bassi del suo predecessore. Aspetto, questo, che ha mandato in tilt le grandi aziende tecnologiche statunitensi, impegnate a investire decine di miliardi di dollari sull'intelligenza artificiale.
"Il lancio del modello R2 di DeepSeek potrebbe essere un momento cruciale nel settore dell'intelligenza artificiale", ha dichiarato Vijayasimha Alilughatta, Chief operating officer del fornitore di servizi tecnologici indiano Zensar. Il successo di DeepSeek nella creazione di modelli di intelligenza artificiale convenienti "probabilmente spronerà le aziende di tutto il mondo ad accelerare i propri sforzi per essere più competitive", ha aggiunto.
DeepSeek: ecco perché produce a basso costo
Il segreto di DeepSeek è quello di richiedere nei propri modelli una quantità più limitata di chip Nvidia, anche se di seconda fascia dopo il divieto da parte degli Stati Uniti della fornitura di semiconduttori come l'A100 a partire dal 2022. Alcuni, come l'Amministratore delegato di Scale AI Alexander Wang, hanno affermato che l'azienda cinese in realtà ha utilizzato ben 50 mila chip Nvidia all'avanguardia che sono vietati per l'export in Cina. Questa accusa in realtà al momento non è supportata da prove.
Secondo i documenti di ricerca di DeepSeek, invece, l'azienda usa tecniche che comportano costi di calcolo molto più bassi. Una è ad esempio la Mix-of-Experts (MoE) che suddivide un modello AI in diverse aree di competenza, che si attivano singolarmente in risposta ad una query. Questo a differenza di quanto accade nei sistemi più comuni, che attivano l'intero modello. Un'altra tecnica è la Multihead Latent Attention (MLA), che consente l'elaborazione contemporanea di diversi aspetti di un'informazione, rilevando i dettagli chiave in modo efficace.
Tutto questo consente a DeepSeek di tenere bassi i prezzi. Secondo gli analisti di Bernstein Brokerage, questi risultano inferiori dalle 20 alle 40 volte rispetto a quelli addebitati da OpenAI. Ciò ha galvanizzato molte aziende cinesi, che hanno iniziato a integrare i modelli DeepSeek nei loro portafogli.
Come rispondono le Big Tech USA
Se per la Cina, DeepSeek è un motivo di orgoglio e anche di euforia nell'ambito della guerra tecnologica con gli Stati Uniti, per il governo americano rappresenta una preoccupazione stringente. Al punto che sono in atto discussioni con i player statunitensi per le strategie di risposta da adottare.
Alcuni comunque stanno correndo ai ripari. OpenAI questo mese ha tagliato i prezzi e ha lanciato il modello O3-Mini che si basa su una minore potenza di calcolo mentre .Google ha applicato sconti per accedere a Gemini.
Una buona notizia è arrivata da Nvidia. Secondo quanto riportato da Reuters, le grandi aziende cinesi come Tencent, Alibaba e ByteDance stanno aumentando gli ordini dell'H20, la nuova scheda chip AI utilizzata proprio per la Cina a causa dei controlli sulle esportazioni USA. Questo potrebbe alleviare l'ansia che il successo di DeepSeek finisca per contrarre il fatturato del colosso di Santa Clara.