Il mantra “Garbage in, garbage out” (GIGO) proviene dalla programmazione: se si immettono dati sporchi o istruzioni sbagliate, il sistema restituirà risultati inutili o dannosi. Nel trading, dove algoritmi, dati in tempo reale e modelli di intelligenza artificiale governano decisioni che muovono miliardi in pochi secondi, il principio GIGO non è solo un avvertimento, ma una vera e propria regola di sopravvivenza.
Capire cosa significa, come si manifesta e soprattutto come prevenirlo è essenziale per chi utilizza modelli di trading e investimento. Ecco tutto quello che c’è da sapere.
GIGO: perché è critico nel trading?
Nel trading automatizzato, la qualità del dato determina la qualità della decisione. Un feed di prezzo ritardato, un valore mancante, un outlier, la mancata applicazione di un corporate action (come uno split o un dividendo) oppure date non allineate possono far scattare segnali sbagliati e, di conseguenza, ordini errati.
GIGO significa che la qualità di ciò che ottieni dipende dalla qualità di ciò che metti in ingresso. Se i dati iniziali sono errati o confusi, anche il risultato finale sarà sbagliato, per quanto sofisticato possa essere il processo usato. Nel trading, la conseguenza non è solo un calcolo errato: può tradursi in ordini sbagliati e, nel peggiore dei casi, in perdite significative.
Un errore frequente, soprattutto nei backtest, è scambiare per valida una strategia che in realtà si basa su dati errati o su una costruzione sbagliata del modello. Può capitare di ottenere una equity line apparentemente perfetta, in crescita costante, che però è frutto di overfitting (quando il modello è “cucito” sui dati storici e non generalizza), lookahead bias (uso involontario di informazioni future nel passato) o data leakage.
Nel peggiore dei casi, la causa non è nemmeno statistica, ma tecnica: bug nel codice, errori nel calcolo di posizioni o prezzi, o date mal gestite. In questi casi, la curva dei profitti è solo un’illusione.
GIGO: nei modelli di IA è ancora più insidioso
Nel machine learning il problema è ancora più complesso. Un modello addestrato su dati parziali, sbilanciati o etichettati male impara regole errate. Questo porta a overfitting, previsioni fragili in condizioni non viste e alla cosiddetta “drift” quando il mercato cambia.
Esempi pratici sono modelli che identificano pattern in particolari regimi di mercato e poi falliscono al variare dello scenario. Etichette sbagliate, leak di informazioni dal futuro (data leakage) e feature costruite in modo improprio sono tutte forme di “input spazzatura” che generano output inaffidabili.
GIGO: cosa può fare un trader retail
La buona notizia è che molte cause di GIGO si possono prevenire con misure pratiche. Prima di tutto, è fondamentale garantire la qualità dei dati, verificando la reputazione e l’affidabilità del fornitore o della piattaforma. L’uso di fonti multiple, controlli di coerenza temporale, pulizia dei feed e solide pratiche di data quality riducono in modo significativo il rischio di input errati.
Prima di lanciare strategie automatiche, è importante eseguire backtest robusti e paper trading il più realistici possibile, includendo commissioni e slippage. È fondamentale inoltre verificare un numero sufficiente di operazioni per capire se il modello si comporta come previsto.
Sul piano operativo, è cruciale disporre di interruttori automatici che fermino il trading in condizioni anomale e di limiti di perdita predefiniti. La revisione del codice e i test in ambienti simulati sono strumenti indispensabili per scoprire bug prima di passare al live trading.