In un contesto in cui l’intelligenza artificiale promette di ridefinire i confini dell’investimento quantitativo, Alpha Arena si propone come un banco di prova senza precedenti. Lanciata dalla società di ricerca statunitense Nof1, la piattaforma ospita l’“AI Trading Showdown”: una competizione tra sei modelli linguistici avanzati, ciascuno dotato di 10.000 dollari per operare in contratti perpetui su criptovalute, tra cui Bitcoin e Solana, sulla decentralizzata Hyperliquid Exchange.
Cos'è e come funziona Alpha Arena
Alpha Arena è il primo esperimento che trasforma i mercati finanziari in un campo di prova per valutare la vera intelligenza dei modelli AI. L’iniziativa intende rispondere a una domanda cruciale: le grandi AI linguistiche sanno davvero investire?
Vediamo le caratteristiche principali di Alpha Arena:
- Un benchmark reale. Non un test artificiale, ma mercati aperti, in tempo reale, con capitale reale. Ogni modello riceve 10.000 dollari da investire.
- Piattaforma di trading. Le operazioni avvengono su Hyperliquid, un mercato di cripto perpetual, ideale per testare capacità di reazione, gestione del rischio e timing operativo.
- Regole comuni. Tutti i modelli competono con gli stessi prompt e gli stessi dati di input.
- Obiettivo. Massimizzare i rendimenti corretti per il rischio, come farebbe un gestore professionista.
- Trasparenza. Tutti gli output dei modelli e le relative transazioni sono pubblici, così chiunque può analizzare le strategie adottate.
- Autonomia operativa. Ogni intelligenza deve generare idee di trading, dimensionare le posizioni, scegliere i momenti di esecuzione e gestire i rischi in modo indipendente.
- Durata. La Stagione 1 si concluderà il 3 novembre 2025 alle 17:00 EST.
- I protagonisti in gara. Alpha Arena ha attirato sul ring i giganti dell’intelligenza artificiale di nuova generazione: Claude 4.5 Sonnet, DeepSeek V3.1 Chat, Gemini 2.5 Pro, GPT‑5, Grok 4, QWEN 3 Max.
Per garantire equità tra i contendenti, le condizioni operative sono rigorosamente standardizzate: ciascun modello riceve gli stessi dati di mercato, gli stessi limiti temporali per eseguire gli ordini e identiche allocazioni di capitale. Il sistema replica anche elementi tipici del trading algoritmico, come slippage, costi di transazione e impatto di mercato, valutando parametri chiave come rendimento giornaliero, drawdown massimo, Sharpe ratio e latenza operativa.
Trading AI: quale modello sta ottenendo le performance migliori?
Iniziato il 18 ottobre, il contest finora è dominato da QWEN 3 Max: il modello linguistico di grandi dimensioni (Large Language Model, LLM) sviluppato dal team QWEN di Alibaba Cloud, dall'inizio ha registrato una performance positiva per oltre 70 punti percentuali.
Anche la seconda posizione parla mandarino con il +37% di DeepSeek Chat V3.1, il chatbot sviluppato dall'azienda cinese DeepSeek. Dalla terza posizione si scende in territorio negativo con il -7% di Claude Sonnet 4.5 di Anthropic. Grok 4 di xAI segna un -10%, Gemini 2.5 Pro di Google DeepMind registra un -62% mentre GPT‑5 di OpenAI un -71%.
Performance percentuali dei modelli AI coinvolti in Alpha Arena. Fonte: nof1.ai
“Il nostro obiettivo con Alpha Arena è rendere i benchmark più simili al mondo reale, e i mercati sono il terreno perfetto”, si legge sul sito del progetto. “Sono dinamici, aperti, imprevedibili. Sfide che i test statici non possono replicare”.
AI e mercati: attenzione alle riflessioni
Secondo Jay Azhang, cofondatore di Alpha Arena e investitore con base a New York, i sei modelli “operano autonomamente con lo stesso set di dati e di prompt, seguendo la logica delle loro decisioni in piena trasparenza”. Sul sito del progetto, infatti, gli utenti possono osservare in tempo reale i portafogli di ciascun modello e persino leggere le riflessioni generate durante le operazioni. Una schermata mostra, ad esempio, il commento di Gemini 2.5 Pro: “Mi trovo di fronte a una potenziale margin call, ma potrebbe anche essere un’opportunità d’oro”, ha riportato Azhang.
Il successo di DeepSeek ha acceso le speculazioni sulle sue origini: il modello proviene da una start‑up cinese spin‑off dell’hedge fund High Flyer‑Quant, che potrebbe averlo addestrato su dati finanziari di qualità.
Non tutti però vedono nell’esperimento la prova definitiva del potenziale degli LLM nei mercati. Secondo Hing Shing Leung, analista azionario a Hong Kong, "gli LLM non dispongono di notizie in tempo reale né di dati proprietari, e le inefficienze che cercano di cogliere sono già sfruttate dalle società quant”.
Mercati in mano ai bot?
Oltre al valore puramente competitivo, Alpha Arena si presenta come un tentativo di creare una metrica data‑driven per la valutazione dell’intelligenza algoritmica in condizioni di rischio reale. “Se riuscissimo a comprendere meglio come i modelli giustificano le loro decisioni di trading, l’esperimento diventerebbe ancora più interessante”, ha commentato Li Jiaxin, ricercatrice presso la Hong Kong University Business School.
Il cofondatore Matthew Siper, dottorando in machine learning alla New York University, sottolinea che “sono già emerse personalità di trading molto diverse tra i vari modelli”. La varietà di comportamenti, sostiene, è il vero elemento distintivo del progetto.
Nof1 prevede di estendere presto il format dell’Alpha Arena a benchmark per l’equity e altri asset, oltre al lancio di una piattaforma consumer per investimenti basati su agenti AI entro la fine dell’anno. In un’epoca in cui la frontiera tra ricerca e finanza diventa sempre più sottile, il duello tra algoritmi non è solo una competizione tecnica, ma un segnale di come l’intelligenza artificiale stia iniziando a misurarsi - finalmente - con l’imprevedibilità dei mercati reali.
Alpha Arena non è solo un contest di trading. È un esperimento sul significato di “intelligenza” in contesti dinamici e competitivi. I mercati, con la loro natura avversaria e imprevedibile, rappresentano il test più duro per valutare la capacità di adattamento e decisione autonoma.
Come suggeriscono gli organizzatori, “i mercati sono la prova definitiva dell’intelligenza”. Nei prossimi giorni, scopriremo se gli LLM di ultima generazione sono solo ottimi conversatori o se, davvero, sanno generare alpha.