Nuovo DeepSeek v4 su chip cinesi: il Dragone farà a meno di Nvidia?

Ascolta questo articolo ora...

Si è verificato un errore durante la generazione del file audio

DeepSeek V4 su chip Huawei, Alibaba lancia lo Zhenwu M890: la Cina ha la sua fabbrica AI al completo, proprio mentre Nvidia presenta i conti

Stasera Nvidia presenta la trimestrale. I numeri saranno probabilmente buoni, forse ottimi. Ma c'è una domanda che difficilmente verrà posta durante la call con gli analisti, e che invece vale più di qualsiasi guidance sul prossimo trimestre: per quanto ancora la Cina ha bisogno di Nvidia? La risposta, aggiornata a questa settimana, è "probabilmente sempre meno". E lo dicono i fatti, non i comunicati stampa di Pechino. In questo articolo vedremo esattamente come si sta muovendo la Cina nella corsa all'AI.

DeepSeek V4: il modello che cambia le regole

Il 24 aprile 2026 DeepSeek ha rilasciato V4, il suo modello di ultima generazione. Due versioni, entrambe open source con licenza MIT: scaricabili, modificabili e utilizzabili gratuitamente da chiunque.
La versione principale, DeepSeek V4-Pro, ha 1,6 trilioni di parametri totali e utilizza un'architettura chiamata Mixture of Experts: invece di attivare tutti i parametri per ogni risposta, il modello mobilita solo quelli pertinenti, circa 49 miliardi su 1,6 trilioni. È come avere un team di 100 specialisti in cui parla solo chi è competente sulla domanda specifica. Il risultato è un'efficienza computazionale molto superiore rispetto ai modelli tradizionali, a parità di qualità della risposta.

Sui benchmark, V4-Pro segna 80,6% su SWE-bench Verified (il test di riferimento per valutare la capacità dei modelli di scrivere codice funzionante) e 93,5 su LiveCodeBench. Sono i punteggi più alti mai registrati da un modello open source. DeepSeek nei propri test interni lo posiziona alla pari con Claude Opus 4.6 e GPT-5.4. La valutazione indipendente del NIST, l'ente americano per gli standard tecnologici, stima invece che V4 sia circa 8 mesi indietro rispetto ai modelli frontier. La verità probabilmente sta nel mezzo, ma anche uno scarto di 8 mesi, ottenuto costruendo tutto internamente, è un risultato che fino a poco tempo fa sembrava fuori portata.

Huawei Ascend: il chip che nessuno si aspettava

DeepSeek V4 non ha usato H100. Non ha usato H200. È stato addestrato sull'Ascend 950 PR di Huawei, il chip AI di ultima generazione del colosso cinese delle telecomunicazioni, lanciato nel primo trimestre del 2026. Non solo: DeepSeek ha dato a Huawei accesso esclusivo anticipato per ottimizzare l'architettura di V4 sul suo hardware, escludendo esplicitamente Nvidia e AMD da questa fase. Il ritardo nel rilascio di V4 rispetto ai tempi inizialmente previsti è stato causato in buona parte proprio dal lavoro necessario per adattare il modello ai chip cinesi.

L'Ascend 950 PR, secondo gli analisti, si collocherebbe tra H100 e H200 in termini di capacità: 144 GB di memoria proprietaria con 4 terabyte al secondo di bandwidth, contro i 4,8 TB/s dell'H200. Il gap esiste ancora, ma si è ridotto sensibilmente.

Huawei punta a produrre circa 750.000 chip AI nel 2026, con un target specifico di 600.000 unità del modello 910C, il doppio rispetto all'anno scorso. Sono già in sviluppo i modelli Ascend 960 e 970, con un target dichiarato di 2x performance a generazione.

Jensen Huang, CEO di Nvidia, ha dichiarato pubblicamente che vedere DeepSeek girare su chip Huawei sarebbe "a horrible outcome for America". La dichiarazione è di qualche mese fa. Nel frattempo, è già successo.

Alibaba Zhenwu M890: il pezzo mancante del puzzle

Se Huawei presidia il training, la fase di addestramento dei modelli, la più costosa e computazionalmente intensa, Alibaba ha annunciato ieri, 19 maggio, il suo chip pensato prevalentemente per l'inference, cioè per far girare i modelli già addestrati su larga scala. Si chiama Zhenwu M890, sviluppato da T-Head, la divisione semiconductor di Alibaba.

Le specifiche dichiarate: 144 GB di memoria GPU e 800 GB al secondo di interchip bandwidth, con performance tre volte superiori rispetto al modello precedente, lo Zhenwu 810E. I numeri commerciali indicano che non si tratta di un chip soltanto da laboratorio: 560.000 unità già consegnate, oltre 400 clienti in 20 settori diversi. La roadmap annunciata prevede il successore V900 nel terzo trimestre del 2027 e il J900 nel 2028.

Come si confronta con l'H200 di Nvidia?

L'H200 ha 141 GB di memoria e 4,8 terabyte al secondo di memory bandwidth (la velocità con cui il chip accede alla propria memoria interna). L'M890 dichiara 144 GB di memoria e 800 gigabyte al secondo di interchip bandwidth, che è invece la velocità di comunicazione tra chip diversi in un cluster: due metriche diverse, non direttamente confrontabili.

Myron Xie di SemiAnalysis ha sottolineato che Alibaba non ha ancora pubblicato il dato di "compute performance", quello che davvero dice quante operazioni al secondo il chip riesce a fare. Brady Wang di Counterpoint Research ha sintetizzato tutta la situazione: "non è un vero competitor dell'H200 in termini di potenza bruta, ma nel mercato cinese è un sostituto credibile." Contestualmente all'annuncio del chip, Alibaba ha anticipato il rilascio imminente del suo nuovo modello linguistico, Qwen3.7-Max.

Il quadro finale: una catena AI senza Nvidia

Messe insieme, queste tre notizie raccontano una storia sola. Nel 2024 la Cina non aveva un modello AI di frontiera e non aveva chip competitivi per addestrarlo. Nel 2026 ha entrambi: DeepSeek per i modelli, Huawei per il training, Alibaba per l'inference. È uno stack AI completo. Non ancora alla pari con il meglio che offre l'Occidente, ma abbastanza maturo da funzionare in modo autosufficiente.

Le sanzioni americane sull'export di chip avanzati avevano l'obiettivo di rallentare questo percorso. Forse ci sono riuscite in parte. L'effetto collaterale, però, è stato spingere la Cina a costruire un'industria che altrimenti non avrebbe avuto la pressione né gli incentivi per sviluppare. TrendForce ha documentato come DeepSeek V4 rappresenti precisamente questo: il primo tentativo concreto di rompere la dipendenza dall'ecosistema software Nvidia su cui è stata costruita quasi tutta l'infrastruttura AI globale degli ultimi dieci anni.

Per chi investe, la domanda rilevante non è se la Cina batterà Nvidia. Il mercato cinese era già in buona parte fuori portata per Nvidia dopo le sanzioni del 2022-2023. La domanda è se, nel medio termine, Huawei e Alibaba riusciranno a esportare questa alternativa in altri mercati come India, Sud-est asiatico, Medio Oriente e Africa a un costo inferiore rispetto all'hardware americano. Quello scenario non è imminente. Ma non è nemmeno fantascienza, e ogni trimestrale di Nvidia d'ora in poi verrà letta anche in questa chiave.

Disclaimer: File MadMar.