Culture foot

Dossier – Remondata : l’Empire de la Data – 1/3

La data est partout et le football n'échappe pas à la révolution statistique. Mais au fait, une data c'est quoi ? Qui fournit des data ? Penaltoche vous donne les clés pour ouvrir les premières portes de l'empire de la data.

Le football d’aujourd’hui n’a très certainement plus rien à voir avec celui d’hier. Plus professionnalisé côté joueur, côté business, bref : plus poussé de tous les côtés. Cette évolution a pu se faire grâce à la « nouvelle révolution industrielle » : celle de la data, la donnée. Impactant de nombreux acteurs, nous nous proposons à travers une série de trois articles, de nous intéresser à l’empire de la data. Mais au fait, c’est quoi une « data » ?

C’est quoi la Data ?

Une data c’est une unité d’information, circulant généralement par un réseau informatique. Couplés aux mathématiques, aux statistiques ou encore aux probabilités, ces dernières peuvent quasiment prédire l’avenir. Ou du moins déterminer le scénario allant se réaliser le plus probablement selon les données analysées. Elles permettent d’élaborer des prophéties avec une certaine marge d’erreur en quelques sortes.

Toutefois, pour qu’elles soient utiles une fois traitées, celles-ci doivent être consciencieusement choisies pour être les plus pertinentes possibles. Pour ce faire, le blogueur Philippe Gargov propose une typologie des data dans le foot : les données primaires, secondaires, tertiaires et enfin quaternaires.

Les données primaires se rapportent à des chiffres basiques, directement extraits de résultats : le score d’une rencontre, le nombre de victoires à domicile par exemple. Les données secondaires quant à elles sont plus poussées mais peuvent être recensées à l’œil nu (nombre de tirs, de fautes, de corners dans un match). Les données tertiaires vont dépasser la capacité humaine : collectées grâce à des outils informatiques elles donnent des indications précises sur les performances individuelles ou collectives : pourcentage de possession, nombre de passes réalisées par exemple. Enfin, viennent les données quaternaires qui se rapportent à l’effort physique individuel : il s’agit notamment du nombre de kilomètres parcourus, des courses de haute intensité, ou encore de la température corporelle.

Une fois celle-ci collectées pertinemment et surtout comprises, leur traitement par de puissants outils statistiques ou mathématiques donnera des indicateurs précis, une sorte de vérité s’apparentant aux fameuses « prophéties » dont il est question. Ce processus s’illustre par exemple avec le modèle statistique développé par l’Observatoire du football qui permet de déterminer la valeur financière d’un joueur.

Ces datas vont donc trouver grande utilité dans le football, mais avant de les étudier pour servir leurs intérêts, les clubs, les journaux ou encore les organismes comme l’Observatoire du football vont devoir se fournir en data, c’est là qu’interviennent les fournisseurs de contenu.

Des chiffres et des lettres

Amisco : système pionnier de la Data footballistique

L’importance de la donnée dans la vie des affaires – et forcément dans le football, n’en déplaise aux vrais passionnés/insupportables puristes est un business comme un autre – a fait apparaître de nouveaux acteurs clés : les fournisseurs de données. Si vous vous demandez à chaque match si des types sont vraiment payés à compter le nombre d’hectares de kilomètres que parcourt N’golo Kanté en une mi-temps, nous allons vous répondre (et la réponse est : oui plus ou moins).

Si aujourd’hui, Opta se présente en leader incontestable du marché, avec des données reprises allègrement sur les réseaux sociaux ou dans les médias, il est bon de préciser que des Français ont joué un rôle prépondérant pour faire émerger les sujets statistiques dans le football.

En effet, dès 1995, des français s’intéressaient déjà au sujet. Leur objectif : créer un système permettant de mesurer la performance d’un sportif de manière objective. Et à l’époque où le GPS était trop approximatif et l’informatique absent des clubs de football, la tâche n’était pas simple. Pour autant, le système Amisco (pour « analyse modélisation informatique de sports collectifs« ) a fini par voir le jour. Le fonctionnement était simple : il s’agissait de déployer du matériel vidéo dans un stade, puis une fois le match enregistré sur cassettes, y faire travailler un algorithme pour éditer les coordonnés géographiques des joueurs et analyser leurs déplacements. Une fois ces trajectoires déterminées, on pouvait en ressortir toutes les variables d’analyse possibles. Après une commercialisation outre-Atlantique et de belles années de développement, la firme azuréenne s’est faite racheter par Stats : géant américain de la statistique désireux d’investir le marché européen.

Avec un système aujourd’hui bien rôdé, Amisco se tourne vers les Analytics, en s’appuyant sur les technologies d’intelligence artificielle de type deep learning. C’est-à-dire des algorithmes assez puissants pour reconnaître par de nombreux calculs en toute autonomie des architectures de données, des phases ou des systèmes de jeu par exemple. Le travail de ces algorithmes pourra ensuite analyser la performance d’une équipe en contre-attaque, son efficacité en passant par les latéraux… Afin de donner toujours plus de sens aux datas.

Pour autant, Stats n’est pas aujourd’hui leader sur le marché de la data football. Il s’agit du géant britannique Opta qui règne en maître sur le rain-té, alors même qu’il s’agit d’une toute autre conception de la data.

Opta : force brute et données brutes

Tout comme Amisco, Opta naît il y a une vingtaine d’années, de l’idée de plusieurs amis autour de quelques pintes. L’idée était originellement plus simpliste que celle d’Amisco : il ne s’agit pas de traduire des performances en statistiques, mais de fournir de la donnée brute. A l’aide d’un stylo et d’un carnet, il s’agissait de recenser ce qui était observable à l’œil nu : de la donnée secondaire donc, en suivant la classification de Gargov.

Aujourd’hui, Opta est un des grands leaders du marché de la statistique sportive, mais avec quelques évolutions. En effet, le stade de la collecte de donnée brute a été largement dépassé : Opta s’est démarqué en proposant des outils et prestations statistiques aux médias, alors même que la Data n’était juste ici que réservée aux clubs. L’exhaustive base de données d’Opta sert les intérêts des médias en se revendant sur commande : « Okay Opta, dis-moi dans quel grand championnat européen y a –t-il le plus de fautes ? » « Okay Opta, donne-moi le pourcentage de contrôles réussis par Paul Pogba sur les trois dernières saisons ».

Pour autant, la méthode initiale de collecte de données n’a pas changé, il y a toujours des hommes derrière les écrans. Précisément des équipes de trois analystes, dont deux chargés de décrypter le jeu des équipes leurs étant attribuées et de noter les faits de jeux les plus remarquables. Au total on recense entre 1500 et 2000 évènements par match : ce travail exige donc une concentration extrême. Le troisième analyste de l’équipe est chargé de superviser ce travail et d’épauler les deux premiers en cas de doute. Une fois le direct passé, les rencontres sont visionnées deux fois encore pour corriger les erreurs et se rapprocher le plus possible de la parfaite collecte de datas.

Au même titre que d’autres secteurs, la data est vivement exploitée dans le football, et ceux depuis maintenant deux décennies. Celle-ci va servir les intérêts de nombreux acteurs de l’écosystème football : les clubs, les journalistes, ou encore les fédérations ou de nombreux tiers.

À propos Clément

Mes parents se sont rencontrés à la buvette du foot. Ça explique sûrement mon amour pour le football et la bière.

0 comments on “Dossier – Remondata : l’Empire de la Data – 1/3

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

%d blogueurs aiment cette page :