Esclusive per gli abbonati
Newsletters
About
UU è una rivista di sport fondata a luglio del 2013, da ottobre 2022 è indipendente e si sostiene grazie agli abbonamenti dei suoi lettori
Segui UltimoUomo
Cookie policy
Preferenze
→ UU Srls - Via Parigi 11 00185 Roma - P. IVA 14451341003 - ISSN 2974-5217.
Menu
Articolo
(di)
Leonardo Piva
Baseball, sabermetrica e altri pianeti
10 ott 2016
10 ott 2016
Intervista a Max Marchi, analista dei Cleveland Indians.
(di)
Leonardo Piva
(foto)
Dark mode
(ON)



 



 



 



Domanda non facile. Io sono parte di un gruppo di persone, abbastanza nutrito, il cui obiettivo è quello di creare una squadra vincente. Alcuni lo fanno andando a cercare talenti in giro per gli Stati Uniti o per il mondo; altri, come possono essere gli allenatori o il team di psicologi, lo fanno cercando di sviluppare nel migliore dei modi i talenti che sono già presenti in squadra. Poi ci siamo noi analisti e statistici, che utilizziamo dati. Siamo tutti impegnati nello stesso lavoro, ciascuno con le proprie peculiarità. Anche se adesso va molto di moda la definizione di “data scientist", non è superficiale definirmi “statistico”: in fin dei conti è quella la mia laurea e sulla carta d’identità è quella la professione indicata. L’analisi dei dati è comunque la mia vocazione, se non lo facessi in ambito sportivo magari lo farei in quello dei trasporti o altri settori.

 



 



Conoscevo il baseball perché lo praticavo fin da bambino, è una passione molto forte. Parallelamente a questa ho sempre avuto anche la passione per la statistica: ho studiato statistica all’Università e mi era capitato di trovare nella biblioteca della facoltà riviste specializzate sulla statistica applicata allo sport. Baseball ma anche altri sport. Per cui mi ero reso conto che esisteva questo punto in comune tra queste mie due grandi passioni. All’epoca non pensavo minimamente potesse diventare il mio mestiere, non perché non avessi ambizioni ma perché non pensavo minimamente potesse esistere questa strada. Io mi sono laureato nel 2002 e solo l’anno seguente uscì il libro Moneyball mentre nel 2011 uscì l’adattamento cinematografico. All’epoca non era da molto tempo che le squadre si avvalevano dei primi analisti. La prima scintilla fu comunque in quel periodo e grazie a quelle riviste.

 

Poco dopo inizio a scrivere approfondimenti sul mio sito personale in italiano: non scrivevo solo di statistiche ma di baseball in generale. C’era quindi una sezione storica, una dove scrivevo recensioni di libri a tema e poi una dedicata all’aspetto matematico. Su internet si riesce ancora a trovare qualcosa ma purtroppo non c’è più tutto il materiale che avevo prodotto. Poi in quel periodo consultavo spesso siti americani tipo Baseball Analyst, che purtroppo ormai non c’è più, Baseball Prospectus e Hardball Times. Ogni giorno si trovavano e si trovano analisi, anche se oggi gli articoli di analisi statistica non sono più cosi frequenti e hanno spostato l’attenzione verso lo scouting. Questo, secondo me, è dipeso dal fatto che molti di quelli che anni fa scrivevano per questi siti sono poi finiti a lavorare per le società Mlb. Mi chiedo se poi questa minore produzione dipenda dal fatto che non c’è stato ricambio oppure se ora le società riescono a individuare gli statistici più competenti e promettenti prima ancora che inizino a fare le loro analisi su internet. All’epoca però, devo ammettere, che c’erano diversi programmi utili a fini statistici che nascevano e c’era diverso materiale inesplorato. Ora sono passati una decina d’anni, sicuramente c’è ancora del materiale inesplorato, motivo per cui non voglio dire che il settore sia ormai saturo, però non più così tanto come all’epoca.

 



Andai a San Francisco a un convegno chiamato PITCHf/x Summit, un programma utile per il tracciamento dei lanci. Era il primo convegno che facevano, così presi le ferie e invece di andare in vacanza andai ad assistere a questo convegno. Anche se poi la durata effettiva era di un giorno, e alla fine ci fecero assistere a una partita quindi il tempo per le vacanze ci fu lo stesso. In quell’occasione ebbi l’opportunità di conoscere diverse persone, tra le quali Alan Nathan che è professore di fisica. Prima si impegnava nello studio e insegnamento di acceleratori e particelle, ora di baseball. Dopo una chiacchierata con lui mi convinse a scrivere sul mio sito in inglese, lo feci e dopo un paio di settimane Hardball Times mi chiese se invece di scrivere sul mio sito volevo scrivere per loro. Iniziai con loro ma dopo iniziai a scrivere per Baseball Prospectus. Questa è la mia strada che mi ha portato ai Cleveland Indians. Per tornare quindi alla domanda precedente, quello che posso dire è che aver pubblicato le mie ricerche è stato un buon trampolino di lancio: farsi conoscere è sempre importante. Per esempio, se uno è appassionato di basket probabilmente conoscerà il sito The Nylon Calcolous, riuscire a iniziare a pubblicare per un sito come quello o analogo può essere un buon modo per iniziare. Pubblicare online ha il vantaggio di essere criticati, purtroppo a volte dai troll ma anche da persone competenti, e ha il vantaggio di raggiungere chiunque, club compresi, che spesso leggono siti specializzati per trovare idee o conferme.

 



 




Il baseball, per quanto magari agli occhi di un italiano possa sembrare uno sport difficile, ha un’analisi statistica relativamente semplice perché è uno sport con azioni che hanno un inizio e una fine molto chiari, e ha un numero abbastanza limitato di possibili esiti. Mentre nel basket, come negli altri sport con la palla sempre in movimento, non è la stessa cosa. Forse nel baseball abbiamo la vita un po’ più facile e forse è uno dei motivi per cui si è sviluppato prima. Allo stesso tempo, però, andare a “curiosare” in analisi statistiche più “complicate” di altri sport può sicuramente fornire delle idee per alcuni aspetti del gioco.

 




Sicuramente il baseball ha avuto la possibilità di partire prima di queste grandi innovazioni tecnologiche, tracciamenti con telecamere, radar e così via, perché da sempre quando si giocano le partite viene compilato anche il box score e il play by play. C’è una società di volontari, inizialmente chiamata Project Score Shett e ora invece Retrosheet, che fornisce i play by play di di una marea di partite, e con il tempo aggiungono sempre più partite e stagioni in là nel tempo. Oggi l’archivio conta partite fino agli anni ’40, per cui se una persona volesse vedere cosa ha fatto Joe DiMaggio nella sua ultima partita ha la possibilità di farlo. All’epoca magari non erano disponibili e non c’erano le tecnologie, ma potenzialmente oggi si potrebbero fare analisi approfondite su giocatori del passato molto più che durante la loro epoca. Questa possibilità è sia figlia delle tecnologie di oggi che della mentalità americana, che ha fatto sì che queste statistiche venissero tenute da sempre. Oltre ovviamente alla già citata semplicità della sintassi del baseball: da quando finisce un’azione all’arrivo del prossimo battitore ho tempo per scrivere cos’è accaduto. Nel basket, o ancora meno nell’hockey, tutto questo diventa più difficile.

 

Tornando alla domanda, c’è una differente mentalità. Basta andare su Linkedin per vedere come ci sia un abisso di lavoro tra Stati Uniti, e in seconda battuta direi Gran Bretagna, e poi il resto dell’Europa. Quando vedo annunci italiani e vado a leggere scopro poi che in realtà cercano più un informatico che prepari un database rispetto a uno statistico che la analizzi. Negli Stati Uniti e nei paesi anglosassoni in generale c’è molta più attenzione per la statistica, il calcio è uno sport globale e di conseguenza in minima parte è presente in aree geografiche così attente alla statistica.
Grazie a un giornalista olandese, dove il baseball è abbastanza diffuso e anche lui appassionato di statistica, venni a sapere la storia del Midtjylland che è sicuramente un caso interessante. Sempre grazie a lui ho saputo di Simon Farrant, in passato nello staff del Manchester City che però durante l’epoca, se non sbaglio, di Roberto Mancini non veniva mai ascoltato. A riprova comunque della nostra scarsa attitudine.

 



 



Il primo libro che lessi, credo attorno al 2001, fu Curve Ball di Jim Albert e Jay Bennett. È un libro sulla statistica applicata al baseball. Ma senza formule, molto pratico, e sicuramente comprensibile anche per un non statistico, lo può leggere chiunque. Io ne ho anche scritto uno in compagnia di Jim Albert, il titolo è Analyzing Baseball Data with R.

 


In una delle prime scene di Moneyball il personaggio interpretato da Brad Pitt ha un colloquio ricco di divergenze con il proprietario degli Oakland Atheltics in merito all’approccio da adottare nel costruire la squadra per il prossimo anno. In base alla tua esperienza e conoscenze nell’ambiente, esiste ancora una differenze di vedute così forte?

 

Credo che ora le parti siano abbastanza in sintonia. Mentre un tempo esisteva più la figura del proprietario padrone che faceva e disfaceva tutto, e l’ex proprietario degli Yankees George Steinbrenner ne era forse l’esempio più lampante, oggi forse si è più nella direzione di quella che loro chiamano “absentee ownership” ovvero “società assente” ma non che lo sia davvero. Semplicemente c’è un general manager che riceve fiducia e incarichi dalla proprietà. Il trend è positivo, la gestione di un club diventa sempre più impegnativa che non è più pensabile che una persona possa fare il bello e il cattivo tempo. Anche per quello che riguarda l’analisi statistica, ci si è resi chiaramente conto che è molto importante per cui non esistono più proprietari che ne ostacolano i processi. Anche perché l’analisi statistica permette di abbattere un po’ i costi, che ai proprietari piace sempre. Un tempo si assumevano analisti statistici per essere davanti a tutti, ora lo si fa per non rimanere indietro.

 



 

Sì, può essere. Se ti fai coinvolgere emotivamente ti può creare dei problemi, dipende poi anche da persona a persona. È importante conoscere bene sé stessi e sapere che se anche mi diventa simpatico un giocatore questo non mi potrà influenzare nel momento di prendere delle decisioni. Io personalmente ho sempre molto poco a che fare con i giocatori, non posso dire che siano fuori dal mondo come i giocatori di altri sport però in generale li conosco personalmente molto poco e in generale ho avuto anche poche occasioni. Il massimo è un saluto nella mensa comune durante gli spring training. Io comunque le partite le guardo sempre in televisione, quindi i rischi sono minimi.

 



 




 

Purtroppo no, lui lavorava agli Indians ma successivamente ha lavorato per Oakland, Los Angeles Dodgers, San Diego e New York Mets. Ora ricopre un ruolo molto importante ai Cleveland Browns, nella Nfl, ma non sono mai riuscito a incontrarlo. Quella passaggio del film immagino comunque sia storicamente corretto, lui era la mente. Io mi baso molto sul libro, ma il film è molto fedele. Il fulcro di Moneyball, che però a volte è stato un po’ travisato, era quello di trovare un sistema per valutare i giocatori che sia migliore dei sistemi già utilizzati, e quindi andare a sfruttarlo in ambiti dove le altre squadre possono non accorgersene. In quel momento storico in particolare l’idea di fondo era fregarsene della difesa, anche perché non avevano individuato un metodo per misurarla, e fregarsene della velocità di un giocatore perché era considerata una caratteristica sopravvalutata; guardiamo solamente coloro che hanno la capacità di arrivare in base anche se il loro gioco è antiestetico. Un concetto generale da tenere a mente è che non esiste una formula magica ma è sempre la ricerca della migliore valutazione possibile dei tuoi giocatori: bisogna giudicare i giocatori meglio di quanto non facciano gli altri, bisogna trovare i punti dove gli altri stanno sbagliando. Per esempio, nel basket va molto forte il tiro da tre e il tiro da sotto mentre poco il tiro dalla media distanza, immagino che tra qualche anno le difese si adatteranno a questo stile offensivo e quindi verrà riscoperto il tiro dalla media perché nessuno magari è più così bravo a contrastarlo.

 

C’è sempre una grande evoluzione per cui un vantaggio lo puoi sfruttare finché puoi ma devi sempre essere pronto a rinnovarti. Prima o poi diventa palese la tua strategia, gli avversari si adattano o te lo copiano e quindi prima di essere nuovamente inglobato devi avere già qualcosa di nuovo. Questo è un discorso statistico ma allo stesso tempo è anche intuito. Tanto per dire, il libro successivo a Moneyball era The Extra 2% e parla dei Tampa Bay Rays ed è più o meno un analogo di Moneyball stesso, parla di come la squadra arriva dai bassifondi ai vertici. Il tutto andando alla ricerca del 2% in più da fare rispetto alle altre squadre: in attacco, in difesa, in tutto. Se in ogni aspetto riusciamo ad avere un 2% in più, quando li andremo a sommare avremo una squadra vincente.

 




Moneyball è stata considerata una statistic revolution e come nelle rivoluzioni poi si finisce per tagliare le teste a quelli del regime precedente. Ci sono questi passaggi forti. Sicuramente all’epoca c’era qualche concezione un po’ “medievale” però poi libro e film hanno calcato un po’ la mano su questa cosa. Oggi non è più così, quando sono arrivati i dati che hanno permesso di analizzare alcuni aspetti del gioco che prima non erano analizzabili, e quindi ci si affidava e fidava dell’esperienza, alla fine il 90% dei dati hanno confermato quello che si pensava. Poi c’è quel 10% di situazioni in cui si è arrivati a pensare che si stava sbagliando tutto e qui c’è è nato lo scontro tra i fautori delle statistiche e quelli che non volevano cambiare opinioni perché fino ad allora si era ragionato sempre così.

 




Sicuramente ha enormemente ridimensionato l’importanza che veniva data alla media battuta, che una volta era la statistica principe del baseball. In quel periodo ci fu un articolo rivoluzionario di McCracken che sottolineava come la media battuta concessa da un lanciatore fosse quasi sempre casuale. È influenzata da tantissimi aspetti, quindi usarla per valutare un lanciatore è quasi inutile. Questo su un grosso cambiamento. Un altro cambiamento è relativo all’importanza della percentuale di battuta, oggi su giornali e siti è ancora presente però sempre più accompagnata a fianco dalla OBP, ovvero il dato della percentuale sull’arrivo in base di un battitore. Forse la gente fa ancora fatica a fare questo passaggio, la percezione della percentuale di battuta è ancora forte perché per una vita nel baseball si è stati abituati a guardare quel dato sui giornali o sul retro delle figurine.

 



 


Sì, è stato un po’ il padre tant’è che penso sia stato proprio lui a coniare il termine “sabermetrica”. Negli anni ’70 lavorava come guardiano in una fabbrica di scatole di fagioli, passava diverse notti a fare i turni di guardia e non essendo molto impegnato durante quei turni si impegnava a fare analisi statistiche andando oltre a ciò che c’era sui tabellini. Le sue prime raccolte di dati, chiamate Baseball Abstract, la spediva direttamente lui a casa di coloro che si erano mostrati interessati, da lì in poi arrivarono gli accordi con le case editrici. Fu uno dei primi a pensare a cosa realmente portava punti a una squadra andando oltre alla media battuta. Fu uno dei primi a cercare una risposta alla domanda “cosa devo fare per vincere una partita in più?”.

 



Non so se esattamente cosa fosse successo nella sala degli Oakland Athletics, ma il libro fa sembrare appunto che sia in corso una guerra tra queste due fazioni. In realtà, tutte e due hanno lo stesso obiettivo ed è quello di far vincere la squadra. Hanno metodi diversi e professionalità diversi ma puntano tutti sullo stesso obiettivo, per cui è importante che siano sulla stessa frequenza d’onda. Per carità, è un processo complicato ma è bisogna sempre tenere a mente che l’analisi statistica non dice sempre il contrario di quello che dice lo scouting. Il più delle volte lo rafforza o lo quantifica in maniera più precisa. Dove uno scout può dire “questo è un giocatore che vale molto”, lo statistico può completare l’affermazione sostenendo come “questo è un giocatore che fornisce 2,4 punti in più ogni 10 partite”. Ora questi aspetti stanno sempre più confluendo, un tempo da una parte lo statistico aveva tanti dati su cui valutare un giocatore e lo scout momenti di gioco per lo più basati sulla correttezza dei movimenti. Stanno convergendo grazie alle tecnologie di tracking che ormai sono presenti in tanti sport, nel basket e nel football per esempio si usa molto SportVu e puoi vedere determinati movimenti per tutte le partite. Ora poi ci sono anche delle aziende che producono maniche speciali per i lanciatori in grado di fornire dati statistici, in partita non si possono usare però in allenamento sì.

 



Direi di no, ma non perché non le ritenga importanti. Più che altro per poter portare esclusivamente la mia competenza e lasciare che altri portino la loro in modo che nessuno abbia la possibilità di influenza l’altro. Non so se questo sia giusto o sbagliato. Nel libro Moneyball c’è un aspetto che credo nel film non emerga: per l’imminente draft decidono di concentrarsi su battitori che provengono dai college piuttosto che dalla high school, ma solo perché le loro proiezioni evidenziavano minori rischi nel primo caso rispetto al secondo. Quindi anche in quell’occasione era tutto orientato dalle statistiche. A me personalmente questi aspetti non interessano, ma questo non vuol dire che non interessino nemmeno al club, anche se di certo non sono aspetti di cui chiedono conto a uno statistico.

 



 




Serve sicuramente un software, a volte anche più di uno. Il dato lo puoi ottenere tu internamente o affidarti a qualche collettore di dati, come per esempio può essere Opta per il calcio. Anche nel baseball ce ne sono vari, alcuni dei più importanti sono Sportvision, Trackman e Statscast. Questi sono provider esterni che hanno i loro costi e quindi poi le società possono fare le loro valutazioni su costi e benefici e decidono cosa fare.

 

Il primo passo quindi è la decisione del data provider. Il secondo è il software: alla fine ce ne sono ogni tipo, anche d gratuiti, per cui uno ha la massima libertà di scegliere quello che preferisce. Noi usiamo soprattutto R, che è gratuito per cui il solo costo è quello dell’analista, ma penso sia abbastanza diffuso. Anche i software gratuiti quindi possono essere molto professionali, ma di solito si valuta di situazione in situazione. Un club solitamente ha a proprio libro paga un database administrator e programmatori informatici per poter creare un prodotto. Il problema più grande in Italia e nel mondo, ma non solo per quanto riguarda la parte sportiva, è che ormai c’è una quantità di dati enorme e ogni secondo ne è arrivo di nuova. La sfida più grossa è trarre informazioni utili da questa enorme montagna di dati, per cui se prima il desiderio era avere dei dati in più ora è quello di sapere come fare a non farsi travolgere da questa enorme mole di informazioni.

 



C’è un’area grigissima. Posso capire non ti stia bene che qualcuno prenda dati su di te senza che tu lo sappia, potrebbe anche vagante richiamare la Stasi dell’Europa dell’Est e suona anche un po’ inquietante. Dall’altra parte ci può essere anche un utilizzo sbagliato di internet e in particolare dei social network: far sapere a tutti che si va in vacanza, per esempio, non fa altro che aumentare le informazioni che tu stesso metti a disposizione. Se da un lato non voglio essere spiato poi però non devo neanche fornire dati che non sono nemmeno richiesti.

 

Poi ci sono casi analoghi ma allo stesso tempo meno pericolosi: per esempio quando Amazon e Google mi forniscono consigli non richiesti su prodotti commerciali in base alle indicazioni sui miei gusti. Io magari ho fatto un favore cliccando e/o comprando, quindi incrementando i loro guadagni, mentre loro hanno fatto un favore a me facendomi conoscere qualcosa che non conoscevo. Secondo me, tenendo comunque presente il discorso globale, prevalgano un po’ di più i vantaggi sugli svantaggi. Faccio un esempio: nel mio lavoro precedente, presso la Regione Emilia Romagna, facevo analisi statistiche in ambito sanitario. Il lavoro era organizzato nel modo migliore possibile e l'attenzione verso un tema sensibile come la privacy era alta. Però allo stesso tempo provo a fare questo ragionamento: se io invado la tua privacy, specialmente in un ambito così personale e sensibile, è un grosso problema, allo stesso tempo però in una situazione di epidemia sarebbe importante riuscire a prevenire e poter scavalcare quindi un po’ certi passaggi e pensare all’interesse della salute collettiva e quindi a un obiettivo maggiore. Riuscire a tracciare le epidemie, a capire dove risiede il fulcro, sarebbe più importante che la privacy personale. Ovviamente poi il problema è che poi non tutti rispettano un certo comportamento e alcuni fanno un uso improprio di un potere così grande.

 

Discussioni di questo tipo stanno emergendo anche nello sport: ormai i giocatori non vengono seguiti più solo in campo. Diverse squadre, tra cui credo anche i San Antonio Spurs, utilizzano un mini gps chiamato Catapult per capire diversi aspetti del giocatore, dalla velocità ai giorni di riposo di cui eventualmente necessità, perfino ai gradi di asimmetrie nella postura. Si sta discutendo la possibilità di tracciare anche la qualità del sonno, per esempio, e quindi anche qua si entra in una zona grigia: stai monitorando la sua qualità del sonno per avere più garanzie sulla sua prestazione sportiva oppure per sapere se quella sera ha condotto una vita da atleta professionista o si è andato a divertire?


 

 

Attiva modalità lettura
Attiva modalità lettura