A che punto sono le statistiche nel calcio
Quanto sono affidabili, come vanno lette, dove si può migliorare. Una panoramica della situazione.
Le statistiche oltre gli Expected Goals e il loro utilizzo nei media
di James Yorke
Passaggi, dati fisici e analisi della difesa: andare oltre gli xG
Gli expected goals hanno dotato le football analytics di una strana traccia da seguire. I dati necessari a costruire un modello di Expected Goals non erano pubblici e le abilità tecniche per costruire un modello del genere erano altamente specifiche e tutt’altro che banali. Perciò, per un lungo periodo, i membri della comunità hanno costruito nuovi modelli di xG, o comunque hanno cercato di ragionare a proposito di essi.
L’effetto ottenuto è che l’evoluzione delle analytics si è focalizzata intorno ad argomenti correlati agli xG: i modelli sono diventati sempre più complessi, ma il concetto base è rimasto sempre quello del valore atteso e forse gli analisti non hanno osservato altre aree di rilievo.
Più recentemente gli studi sui passaggi hanno acquisito sempre maggiore importanza, con l’obiettivo di identificare i giocatori e le squadre più efficienti e abili a muovere la palla. Rimane comunque difficile separare la descrizione puramente stilistica dalle risultanze effettivamente influenti sulla possibile vittoria di una partita di calcio (un punto fondamentale nello sviluppo a lungo termine di qualsiasi metrica, ovviamente).
C’è molta aspettativa riguardo ai “tracking data” che potrebbero aggiungere nuovi fattori e, di conseguenza, aumentare la precisione dei vari modelli, ma ancora non ci sono dati disponibili pubblicamente ed è comunque possibile che anche un eventuale perfezionamento sia solo marginale – una critica che, ad esempio, potrebbe essere mossa a proposito dell’aggiunta di dati di corsa e sprint.
Le analisi difensive rimangono decisamente le più complicate, soprattutto a livello individuale, la speranza è che un aumento nella qualità dei dati permetta di fare luce anche su questo aspetto.
L’utilizzo delle statistiche nei media
Nel frattempo le statistiche sono sempre più utilizzate nei media , anche grazie all’interesse per giochi costruiti attorno a un aspetto predittivo (come il Fantacalcio o Football Manager), oltre che per siti analitici aperti al pubblico come Squawka e Whoscored. Soprattutto per le nuove generazioni, sembra ormai radicata l’accettazione di una descrizione numerica dei giocatori e squadre.
Si sente parlare sempre più spesso di numeri a proposito di tiri e di occasioni create sia a livello di squadra che di giocatore, un’attenzione che però rende ancor più necessario un secondo livello di analisi, e questo è certamente positivo (gli xG da soli potrebbero essere troppo “esoterici” per un utilizzo puramente mainstream).
Jamie Carragher è uno dei più importanti “pundit” (esperti) di analisi calcistica in Inghilterra, importante per il suo lavoro di divulgazione.
Meno positivo, invece, è l’utilizzo forzato di statistiche che non rappresentano quello per cui vengono utilizzate. Facciamo un esempio: dati difensivi come contrasti e intercetti sono spesso letti come se “più” fosse sempre “meglio”, quando in realtà si tratta di dati poco più che descrittivi, che non riflettono necessariamente la qualità di gioco. Nemmeno i portieri possono essere valutati accuratamente tramite il computo delle parate.
Semplici liste, basate su una o due statistiche, non permettono di classificare i giocatori, a meno che non si tratti di metriche offensive.
Le statistiche sono sempre di più e sempre più accettate, ma serve ancora tempo prima che si diffonda un tipo di analisi più ragionata, in grado di cogliere anche le sfumature. Ci vuole tempo, e un certo livello di competenza, per saper leggere l’autentico significato nelle statistiche calcistiche: cose che spesso mancano nell’utilizzo che ne fanno i media.
Ma questo è un problema esistente anche all’interno dei club professionistici, dove gli analisti delle performance stanno introducendo le statistiche all’interno del loro lavoro spesso senza capire cosa sia davvero importante e cosa no. Finché non sarà chiara l’esigenza di utilizzare i dati con costrutto il loro utilizzo sarà per forza di cose solo marginale (come succede nei club), oppure degradato a livello di curiosità o poco più (come succede nei media).
Anche l’utilizzo dei grafici è aumentato nei media, ma le mappe sulle posizione medie, oppure le heat-map, raramente sono capaci di dirci ciò che è davvero successo sul campo; e la loro popolarità ne ha causato anche un utilizzo a sproposito. Nonostante ciò non bisogna dimenticare che le mappe di tiro (con o senza i valori di xG) o anche i grafici che evidenziano alcuni passaggi specifici o le occasioni create, possono rivelare verità significative su una gara, una squadra o un giocatore.
Il problema è chi dice: “Guarda questo giocatore calcia sempre da 30 metri ma non segna mai”, con la mappa che diventa un modo un metodo molto semplice di presentare e provare un’opinione.
Bisogna avere chiaro un principio: una statistica deve essere presentata solo se capace di aggiungere una chiave di lettura all’interpretazione di un evento. Se è in grado di rivelare verità nascoste, accessibili e rapide da comprendere.
C’è sicuramente del lavoro da fare sotto ogni punto di vista. Solo l’interazione di squadra tra esperti di visualizzazione, narratori e analisti può alzare il livello complessivo e permettere un utilizzo razionale e davvero utile dei dati.
James Yorke è il Managing Editor del sito di analytics StatsBomb e collabora regolarmente con ESPN insider.