Avete mai sentito parlare della "saggezza della folla"? È quel fenomeno per cui l'opinione media di un gruppo di persone è spesso più accurata del parere di un singolo esperto.
Nel 1907, Francis Galton osservò che in una fiera di bestiame, la media delle stime di 800 persone sul peso di un bue si avvicinava sorprendentemente al peso reale - più di qualsiasi stima individuale.
Come sto scoprendo leggendo "The Book of Why" di Judea Pearl (citato in un mio post precedente), Galton fu anche uno dei primi studiosi, insieme a Karl Pearson, a sviluppare il concetto di correlazione statistica. Curiosamente, entrambi avevano difficoltà ad accettare o formalizzare adeguatamente il concetto di causalità, preferendo concentrarsi sulle relazioni statistiche osservabili piuttosto che sui meccanismi causali sottostanti. Una limitazione che la scienza dei dati moderna sta cercando di superare.
Cosa c'entra questo con il machine learning?
I metodi ensemble applicano esattamente questo principio agli algoritmi. Invece di affidarsi a un singolo modello predittivo, combinano più modelli per ottenere risultati superiori:
- Random Forest: aggrega decine o centinaia di alberi decisionali, ciascuno "addestrato" su sottoinsiemi diversi di dati e feature
- Gradient Boosting: costruisce modelli in sequenza, dove ogni nuovo modello corregge gli errori dei precedenti
- Stacking: combina modelli di diversa natura (SVM, reti neurali, kNN) facendo "votare" le loro previsioni
Perché funzionano così bene?
- Riducono la varianza: le fluttuazioni casuali dei singoli modelli si compensano a vicenda
- Limitano l'overfitting: diversi modelli "generalizzano" in modi diversi
- Aumentano la robustezza: il fallimento di un modello viene mitigato dagli altri
Proprio come nella folla di Galton, dove alcuni sovrastimavano e altri sottostimavano, gli errori tendono a cancellarsi reciprocamente.
La lezione per tutti noi
Che tu sia data scientist, manager o semplicemente interessato all'AI, c'è un insegnamento potente: nelle decisioni complesse, la diversità di prospettive è spesso la via migliore.
A meno che tu non sia Yoda con 900 anni di saggezza galattica alle spalle, probabilmente otterrai risultati migliori combinando diverse opinioni (o modelli) piuttosto che affidandoti a un singolo "esperto"… anche se quest'ultimo parla al contrario e ha le orecchie verdi a punta! 🧠👽