Negli ultimi anni, l’utilizzo della analytics applicate al calcio ha subito un’accelerata importante. Non solo nell’adozione da parte dei club professionistici e dei media, ma anche nella varietà degli strumenti a disposizione. Il numero di nuove aziende innovative nel settore è in costante espansione, anche grazie alla crescita del mercato dello SportsTech in Europa, settore in cui nel 2019 sono stati investiti oltre 500 milioni di euro, di cui il 45% in startup dedicate al monitoraggio delle attività e delle prestazioni sportive.
Sempre più club si affidano, con diversi gradi di integrazione, agli strumenti della data science con la volontà di prendere decisioni sempre più informate a bordo campo e sul calciomercato, anche grazie alla spinta di squadre come Leicester e Liverpool, che rappresentano casi di successo conclamati per quanto riguarda l’impiego di tecnologie innovative.
Gli Expected Goals e i modelli associati sono diventati ormai parte integrante dell’analisi anche dei media più generalisti, ma rimangono ancora molte opportunità di ricerca nel campo degli “event data”, ovvero quei dati che tengono in considerazione solo quello che accade in relazioni ai tocchi di palla.
Adesso che siamo in grado di misurare la “qualità” dei tiri, il focus si sta gradualmente spostando sulla misurazione del valore di passaggi, tiri, contrasti, intercetti e tutti gli altri eventi che riguardano la palla. L’attenzione della ricerca a medio e lungo termine si sta concentrando su analisi di costo/beneficio, con l’obiettivo di comprendere meglio il valore di determinate giocate e dunque di ottimizzare il gioco di squadra sia in fase offensiva che difensiva, oltre che le valutazioni di quanto avviene sul campo.
È però opinione comune che la prossima frontiera tecnologica sarà segnata dall’impiego dei “tracking data”, ovvero quei dati che vengono monitorati più volte al secondo, di solito con l’ausilio delle telecamere installate allo stadio, e che catturano in maniera continua la posizione della palla e dei 22 calciatori in campo. Una tecnologia già ampiamente sfruttata in NBA, che rende questo tipo di dati disponibili addirittura sul proprio sito ufficiale.
Questo tipo di dataset non sono ancora disponibili pubblicamente per i principali campionati europei, ma sono già a disposizione di molti club europei e italiani. Proprio per incentivare l’adozione di nuovi processi di analisi, la Lega Serie A ha appoggiato l’adozione di un innovativo sistema denominato Virtual Coach e sviluppato dalla startup italiana Math&Sport, con l’obiettivo di fornire a tutte e 20 le squadre di Serie A uno strumento che le mettesse in condizione di analizzare in tempo reale i dati di tracking relativi alla propria squadra e agli avversari.
Per approfondire le caratteristiche e le potenzialità dello strumento, abbiamo intervistato Gilberto Pastorella, Product e Account Manager di Math&Sport e Jacopo Aloe, che si occupa invece del Customer Support.
Come nasce il progetto “Virtual Coach”? Da dove siete partiti per farvi le ossa nel mondo dello sport?
Quanti siete in Math&Sport? Avete specialisti dedicati per sport?
Pensate di focalizzarvi su calcio e pallavolo? Escludete di lavorare con altri sport?
In questi casi siete partiti da una loro richiesta specifica o lavorate voi sui dati disponibili per poi proporre loro soluzioni?
Che è il cuore di “Virtual Coach” (VC da qui in avanti, nda). VC nasce da questa esigenza di lavorare sul real time? Oppure c’era stato prima da parte vostra un approccio più classico, di tipo event data?
VC nasce comunque da una vostra ricerca o era una ricerca specifica di un committente come la Lega Calcio?
E VC nasce contestualmente alla fondazione di Math&Sport, nel 2017? Quando avete avuto un MVP in produzione?
Spiegaci, che cos’è VC?
Perché non è opportuno avere un modello puramente machine learning? Perché la macchina dev’essere istruita a priori, come accade in un modello deterministico?
Aspetta, intendi dire che ci sono ragioni commerciali dietro ad una scelta tecnologica?
Escludi comunque un domani di ridurre al minimo la parte deterministica nel vostro mix? Penso a quello che è successo negli scacchi, dove le nuove intelligenze artificiali hanno cambiato il modo di giocare degli umani che si allenavano con loro.
All’interno di VC generate un centinaio di metriche. Com’è stato il processo di ideazione? Vi siete seduti a tavolino con analisti e allenatori di Serie A o è stato un processo interamente interno?
Com’è fatta visivamente l’applicazione? Quali sono le possibilità di un allenatore o del suo staff in partita?
C’è poi un livello intermedio, che permette di generare e mostrare degli indici di performance. Vengono mostrati come un semplice numero, oppure come delle percentuali di incremento o decremento rispetto a un valore, oppure come un trend degli ultimi minuti.
C’è un ultimo livello, per noi il più importante, che è quello della generazione degli alert. Ogni squadra riceve delle notifiche che il sistema genera automaticamente per aiutare gli staff a capire quali sono gli indicatori che stanno cambiando in maniera significativa, o che sono correlati tra di loro, o che l’intelligenza del sistema ritiene particolarmente importanti in questa fase di gioco. Ogni alert è personalizzabile per ogni squadra. Per esempio, a un allenatore può interessare sapere qual è la pressione che un certo modulo adottato sugli avversari genera sui propri difensori centrali. Noi possiamo sviluppare per lui un algoritmo ad hoc.
Per quello che ci stai dicendo, VC è uno strumento per supportare le decisioni degli allenatori, ciascuno dei quali prova a portare sul campo il proprio modello di gioco. In nessun caso diresti che VC influenza la scelta del modello di gioco o addirittura si sostituisca all’allenatore, giusto?
Invece abbiamo letto in giro alcune note stampa che presentavano l’applicazione come un vero e proprio “Coach virtuale”, cioè una sorta di intelligenza artificiale calcistica in grado di prendere decisioni da sola.
Dopo le note stampa, c’è stato l’episodio della finale di Coppa Italia. Alcune di queste metriche innovative, di cui ci hai parlato, sono andate in onda durante la diretta televisiva della finale, giusto?
Le metriche complesse che avevate generato non sono state presentate adeguatamente e hanno finito per spiazzare lo spettatore. Ti chiedo: chi deve fare il massimo sforzo di fronte a una innovazione del genere? Voi o il media?
Pensate quindi a un processo di formazione che vi coinvolga in prima persona?
A tal proposito, com’è la penetrazione dell’utilizzo dei dati nelle squadre di Serie A? La percezione dall’esterno è che siamo più indietro rispetto ad altri campionati europei.
Queste figure sono collocate per di più nei top-team italiani? Io se fossi un dirigente di un piccolo club, cercherei opportunità del genere per ottenere un vantaggio competitivo che le risorse economiche limitate non riescono a darmi sul mercato.
Però penso che la differenza col resto del panorama europeo sia qui: i club inglesi, tedeschi e spagnoli hanno portato da tempo queste figure nel proprio organigramma. Da noi c’è l’interesse degli staff, che sono però legati a doppio filo con l’allenatore, e quindi se acquisiscono una competenza, ad un certo punto la portano via dal club.
Se il movimento si sta muovendo in una certa direzione, perché sembra che alcuni allenatori mettano ancora i dati fuori dalla discussione calcistica di proposito?
JA: Soprattutto non si può rispondere solo guardando ai dati. Gli allenatori immaginano che guardando i dati si possano trarre delle conclusioni parziali o sbagliate. Ci vuole l’occhio umano in panchina, sempre, anche quando è supportato dai dati. Non si potrà mai sostituire l’esperienza trentennale di un allenatore.
GP: Un tipo di domanda che io immagino accettabile per gli allenatori è: ho notato che il difensore centrale ha subito una pressione superiore alla sua media stagionale, perché è successo? A domande del genere seguirà una risposta per forza, perché prevede una discussione tecnico/tattica.
Quindi come immagini il calcio e la sua fruizione da qui a cinque anni?