In uno sport a basso punteggio come il calcio il risultato maturato alla fine dei 90 minuti non sempre corrisponde alla prestazione delle due squadre. Gli Expected Goals sono stati concepiti proprio per poter misurare il livello di performance di una squadra nel tempo e stabilire se questo è al di sopra o al di sotto dei risultati raccolti in stagione. Nel primo caso si parla di overperformance, nel secondo di underperformance.
Il Milan di quest’anno fa parte del primo tipo di squadre, è una di quelle squadre che non si arrendono alla statistica, che raccolgono più di quanto teoricamente seminato.
Ai primi di dicembre, dopo 15 giornate giocate, la squadra di Montella divideva il secondo posto con la Roma, anche se per gli xG prodotti l’attacco rossonero valeva solo il tredicesimo posto; e allo stesso tempo per gli xG subiti non sarebbero dovuti andare oltre l’ottava piazza.
Oggi il Milan è settimo, dopo aver centrato una vittoria fondamentale contro la Fiorentina, ma la qualità del suo gioco così com’è rilevata dalla statistica non è migliorata: i 27,3 xG prodotti (quasi la metà di quelli generati dalla Roma) valgono al Milan l’undicesimo posto; gli xG concessi, 28 in tutto e decisamente più dei 14,6 xG lasciati dalla Juventus ai suoi avversari, collocano i rossoneri all’ottavo posto.
Il Milan ha imbroccato una serie lunga e fortunata di circostanze che sta determinando i risultati a suo favore? Oppure, magari, esistono elementi riproducibili, ricorrenti e di qualità nel gioco milanista che gli Expected Goals non riescono a rilevare? E, insomma, come andrà finire?
Queste sono le domande da cui muove questo pezzo, ragionando - sempre con l’aiuto delle statistiche - su tre ipotesi che spiegherebbero l’anomalia statistica della squadra di Montella. Tenete sempre presente che il nostro è uno sforzo intellettuale, che tende verso una verità che per definizione è inafferrabile.
Il Milan produce poche occasioni, ma di qualità superiore alla media.
La prima ipotesi con cui spiegare un’overperfomance così continua come quella del Milan è quella secondo cui il Milan produce una quantità minore di occasioni, ma del tipo più prezioso, di quelle più semplici da convertire in rete.
In effetti il Milan non brilla dal punto di vista quantitativo, per il volume di tiri prodotti (13,3 a partita, decima prestazione del campionato). Se a questo numero si accoppia anche il dato dei tiri subiti, si nota che in media il Milan viene dominato dagli avversari per il numero di conclusioni: il suo Total Shot Ratio - la percentuale di conclusioni rossonere nel totale di conclusioni della partita - è stato inferiore al 50% fin dalla prima giornata.
In termini spaziali, la collocazione dei tiri del Milan non lascia intuire una pericolosità più alta della media. Se messe a confronto con quelle dell’Atalanta - che ha effettuato un numero medio di tiri a partita simile (14,7) - le conclusioni del Milan non sono addensate nella zona più redditizia, quella davanti all’area di porta, come nel caso degli orobici.
Quasi un terzo dei tiri del Milan è collocato fuori area: da occasioni di basso profitto (statisticamente lo sono i tiri dalla distanza) i rossoneri hanno ricavato 7 gol su un totale complessivo di 30 reti (rigori esclusi). Solo Bologna, Fiorentina e Cagliari hanno un’incidenza superiore dei tiri dalla distanza sul bottino di reti totale.
Se consideriamo le differenti situazioni di gioco, isolando quelle nelle quali si generano tiri mediamente più pericolosi, il Milan non eccelle.
Per numero di tiri presi dopo un assist vincente (cioè non dopo un dribbling o una palla recuperata, ma direttamente da un passaggio che metta in condizione un giocatore di tirare) i rossoneri sono letteralmente doppiati dalla Roma (99 conclusioni a 208); sulle occasioni che arrivano in conseguenza di un recupero palla alto, il Chievo stacca il Milan di molto (7 a 2).
Più in generale, se consideriamo come pericolosi i tiri che hanno un valore xG tre volte superiore alla media, il Milan è l’undicesima squadra del campionato, per via delle 26 conclusioni prodotte, lontanissimo dalla Roma che ne ha collezionate 62.
Quindi, l’ipotesi che il Milan produca occasioni di qualità superiore decade.
Gli attaccanti del Milan sono migliori della media.
Allora, e questa è la seconda ipotesi, può darsi che il Milan abbia attaccanti con qualità realizzative superiori alla media, capaci di trasformare in gol le occasioni che capitano loro, al di là della frequenza e della pericolosità.
Suso è l’unico milanista in possesso di una statistica significativa per volume di tiri prodotto.
Tra i giocatori di tutta la Serie A che hanno disputato almeno 900 minuti e hanno tirato verso la porta almeno 50 volte, lo spagnolo è quello col minor numero di xG generati, 0,14 ogni 90 minuti. Ciò nonostante, Suso ha segnato 0,25 gol ogni 90 minuti, con una capacità di conversione degli xG in reti reali inferiore solo a quella di Hamsik.
Una tale capacità realizzativa, però, non è sostenuta dalla precisione al tiro: mentre Hamsik mette a segno il 17% dei suoi tentativi, Suso converte in gol solo il 9% dei suoi tiri. Per fare un paragone consistente in termini di posizione in campo, Bernardeschi ha una prestazione migliore di Suso in termini di gol (0,53/p90) e xG (0,17/p90), con la sua Fiorentina che non sta avendo una stagione migliore di quella del Milan.
I giocatori rossoneri dalla precisione più alta non sono due attaccanti, bensì due centrocampisti: Kucka e Locatelli hanno ricavato rispettivamente 4 e 2 reti dai loro 20 e 12 tiri. Il campione di tiri è talmente esiguo da non poter trarre conclusioni più generali sulle abilità dei due sotto porta.
Per quanto riguarda Bacca, l’attaccante colombiano sta vivendo la sua peggiore stagione delle ultime 4 in termini di quantità di conclusioni (-15,8% rispetto allo scorso anno) e di gol (-50%), oltre che per la qualità (xG giù del 23,3%) e per la precisione (-31%) della sua azione davanti al portiere.
Questa seconda ipotesi, quindi, non sembra poter essere verificata.
Il gioco del Milan fa male agli avversari.
Ok, giunti a questo punto sorge spontaneo il pensiero che se magari il Milan non produce tanto quanto poi effettivamente raccoglie è perché comunque fa giocare peggio le sue avversarie.
Nelle scorse settimane, avevo analizzato quanto scadente fosse il tentativo del Milan di costruire il gioco dal basso. Nella zona centrale del campo, invece, la precisione dei passaggi dei rossoneri aumenta (di fatto il Milan è quinto per precisione dei propri passaggi in mediana, dietro Napoli, Juventus, Fiorentina e Roma), ma nel contempo diminuiscono i tentativi.
Una tendenza giustificata dall’urgenza dei centrocampisti rossoneri di verticalizzare verso le punte, e confermata dall’esiguità e della distanza dei tocchi palla negli istanti che precedono una rete dei rossoneri. Ma è una strategia alla dubbia efficacia: per numeri di passaggi completati con successo negli ultimi sedici metri, il Milan è undicesimo.
Anche dal punto di vista difensivo, non c’è un solo indicatore che lasci pensare ad una prestazione fuori dalla norma. Il Milan non ostacola in maniera aggressiva la costruzione bassa degli avversari: il numero dei passaggi e dei recuperi palla nella metà campo offensiva sono allineati alla media del campionato. Il Milan non protegge in maniera particolarmente efficace la propria trequarti campo, zona nella quale i passaggi completati dagli avversari e il numero di tiri bloccati sono ancora in media. Il Milan non limita meglio di altre squadre né il numero dei cross né il numero di passaggi chiave concessi (per i quali fanno peggio del Milan solo Empoli e Pescara in campionato).
Insomma, anche l’ipotesi secondo la quale il gioco del Milan è particolarmente adatto a svelare le debolezze avversarie non sembra vera.
Come andrà a finire?
Ci sono anche fattori difficili da tenere in conto in maniera analitica: sull’atletismo dei giocatori del Milan, l’unico dato a mia disposizione è quello condiviso dal sito della Lega Calcio, e non è neanche positivo, perché quella rossonera è la squadra che corre meno di tutta la Serie A, fatta eccezione per la Sampdoria.
Allo stesso modo non posso esprimermi sulle qualità morali di questo gruppo di calciatori, e se anche in minima parte queste qualità possono essere misurate col numero di gol segnati in situazione di svantaggio c’è da dire che il Milan (5 gol segnati quando in svantaggio) ha fatto molto peggio di altre squadre in campionato (Samp con 11 e Inter con 10).
La linea verde rappresenta l’andamento della differenza reti del Milan giornata dopo giornata, mediato ogni cinque partite. I punti neri rappresentano la differenza media tra gli xG fatti e quelli subiti. Le linee si sono allontanate fino a raggiungere la distanza massima ad inizio dicembre. Ancora oggi non sembrano avere intenzione di ricongiungersi.
Allo stato attuale l’unica conclusione razionale è che la prestazione del Milan è ingiustificatamente al di sopra delle attese. Non resta che da chiedersi: può durare così fino alla fine del campionato?
Nella maggior parte dei casi si verifica la cosiddetta regressione verso la media, ovvero la prestazione reale converge verso il dato statistico. La regressione verso la media è tanto più frequente quanto maggiore è il numero di eventi. In quest’ottica, trentotto partite non sono un numero enorme, c’è una possibilità che il Milan mantenga il suo status ‘overperforming’ fino alla fine.
Ma se parliamo di possibilità, l’unico strumento statistico che abbiamo a disposizione sono gli xG. Allora, tenendo conto della forza delle squadre e della restante parte del calendario, si può azzardare una previsione circa il piazzamento finale dei rossoneri di Montella.
Sia chiaro, quello che sto per proporvi è poco più di un gioco, la cui ipotesi di fondo è alquanto improbabile: che tutte le squadre da qui alla fine del campionato continuino a sviluppare gioco come hanno fatto fino ad oggi (inoltre va ricordato che gli episodi si distribuiscano equamente, come nel caso dell’assegnazione di un calcio di rigore).
Se per un istante riteniamo vera questa ipotesi - e cioè che il Milan si comporterà “da Milan” così come la Roma “da Roma”, il Palermo “da Palermo”, la Samp da “Samp, eccetera - si può simulare al computer l’andamento di ogni singola partita da qui alla fine per un numero enorme di volte. All’aumentare del numero di prove, per la legge dei grandi numeri, la frequenza di un risultato tenderà alla probabilità vera dell’evento.
Ebbene, almeno secondo il computer, la posizione finale più probabile per il Milan a questo punto è proprio la settima piazza, con una media di 61,8 punti tenuta nelle 500.000 simulazioni effettuate delle 13 giornate rimanenti.
Non ci resta che aspettare fino al pomeriggio del 28 maggio per poter farci beffe della macchina.