Nous avons rencontré Jérémy Cheradame, Data Analyst au sein de la Fédération Française de Rugby. En répondant à nos questions sur sa formation, ses missions quotidiennes ou transversales, il nous éclaire sur ce nouveau métier en plein essor dans le champ de l’Analyse de Performance.

Bonjour Jérémy, merci beaucoup de nous recevoir. Tu occupes la fonction de Data Scientist au sein de la FFR. On entend de plus en plus ce mot et donc ce métier dans la sphère des équipes professionnelles. Peux-tu tenter de nous expliquer ce que recouvre ce métier ?

Un data scientist ou data analyst, c’est quelqu’un qui va devoir traiter et analyser des données pour essayer d’en tirer de l’information dans un but d’aide à la décision et notamment, dans mon cas, dans le but d’aide à la décision pour un staff sportif. Cela regroupe deux compétences principales. Une première plutôt informatique qui concerne la gestion de volume, parfois assez important de données, pour pouvoir les manipuler. Dans ce cadre, je peux être amené à créer des algorithmes pour les exploiter au mieux. La seconde compétence est plus mathématique et notamment statistique, confinant parfois avec le Machine Learning, avec la création de modèles pour tenter de comprendre, de mettre à jour, des tendances derrière les données.

Au regard de cet éventail de compétences, pourrais-tu nous présenter ton cursus académique et comment tu as rejoint la FFR et/ou le XV de France ?

Après le bac, j’ai fait une première année de Licence STAPS. J’ai eu mon année mais à l’issue de celle-ci, je ne voyais pas trop d’opportunité pour moi. J’ai donc préféré me réorienter vers des études statistiques. Pour cela j’ai fait un D.U.T STID (Statistiques et Informatique Décisionnelle) à Lisieux. A la suite de quoi, j’ai pu intégrer une école d’ingénieur, l’ENSAI (Ecole Nationale de la Statistique de l’Analyse de l’Information) à Rennes. C’est un cursus de 3 ans avec notamment deux stages appliqués : un premier que j’ai réalisé à la Fédération Française de Rugby en tant que consultant durant 3 mois. Depuis je n’ai jamais vraiment quitté la fédé puisque j’ai fait mon deuxième stage de fin d’étude au sein de celle-ci. Actuellement je poursuis une thèse dans le département d’accompagnement de la Performance. Je partage donc mon temps entre le laboratoire de l’ISPED (Institut de Santé Publique, d’Epidémiologie et de Développement) à Bordeaux, et la fédération.  Ma thèse est centrée sur l’identification des facteurs de risques de blessures  en relation avec la charge de travail. Essayer de comprendre pourquoi un joueur est susceptible de se blesser, en fonction du moment de la saison, du poste, de l’entrainement du joueur, de ses données RPE (Rating of Perceived Exertion)[1], … et sur un versant prédictif essayer d’anticiper des risques de blessures notamment musculaires.

[1] Niveau d’effort perçu » : quantification subjective de la charge d’entrainement

Peux-tu nous présenter plus concrètement certains des travaux que tu mènes dans le cadre de tes fonctions de Data Scientist au sein de la FFR ?

J’ai plusieurs missions au-delà de ma thèse. Je dois élaborer les rapports qui sont utilisés pour les staffs après chaque entrainement et après chaque match. En effet on essaie de pouvoir quantifier au mieux ce que doit faire chaque joueur selon les postes et ce qu’ils font réellement en s’appuyant sur les données GPS, mais aussi avec les données rugby provenant de l’analyse vidéo. On essaye de rassembler les deux pour avoir des informations complètes pour quantifier au mieux le volume, l’intensité ou l’efficacité. Au-delà ce travail, je participe aussi à l’Observatoire du jeu. En relation avec les coachs nous tentons de répondre à ces problématiques ou à des réflexions sur le jeu actuel : comme par exemple la vitesse de rucks en fonction des zones de terrains. Il s’agit de créer des informations qui ne sont pas produites par les fournisseurs de données sportives ou par notre service vidéo.

Ou encore des choses un peu plus exploratoires, comme actuellement, où je travaille sur un modèle d’interaction entre chaque poste, sur chacune des équipes, pour essayer d’identifier des configurations particulières ou des styles de jeu particulier. Voir si l’on peut identifier des circuits préférentiels par exemple. Il y a parfois des choses peu probantes mais nous essayons d’avoir cette réflexion autour du jeu pour alimenter le débat.

A titre d’exemple, je peux aussi vous mentionner le travail réalisé à la suite des travaux de l’INSEP et de l’IRMES (Sedeaud et Saulière). Il s’agit d’une analyse sur l’expérience collective. A l’appui de la composition des feuilles de match de plusieurs équipes nationales ou de club, il s’agissait de tester l’impact des compositions d’équipes sur la performance. L’image ci-dessous rend compte de ce travail. Chaque rond est un joueur ayant au moins une sélection. Plus le rond est gros, plus le joueur a de sélection. Les traits entre les joueurs rendent compte de leur nombre de matchs partagés. La proximité des ronds révèle aussi des communautés d’acteurs, ceux qui interagissent le plus. La couleur nous renseigne également sur le taux de victoire du joueur pour les nœuds et de celui portant sur les matchs partagés entre les joueurs pour les liens.

A quoi peut servir ce type d’analyse ? On s’aperçoit que les équipes le plus victorieuses sont caractérisées par des nuages assez denses et resserrés. En d’autres termes, ceux qui gagnent s’appuient sur des équipes assez stables avec des joueurs cumulant et partageant les sélections. C’est le cas notamment de la Nouvelle Zélande ou encore du Pays de Galles.

Quels sont les outils que tu utilises au quotidien ?

A un premier niveau, je m’appuie sur les fournisseurs de données sportives (OPTA et STATS) qui nous donnent des informations sur nos équipes mais également sur tous les adversaires et ce sur des volumes très important. Nous complétons cela avec notre propre production de données avec les analystes vidéos. Le grain est ici moins large mais beaucoup plus personnalisé et spécifié grâce à nos grilles de codage. Un troisième niveau, forcément très important, avec les données GPS qui sont utilisées au quotidien et qui nous fournissent beaucoup d’informations utilisées principalement par les préparateurs physiques.

Mon travail est donc de compiler ces trois sources de données pour répondre aux différentes problématiques. Pour réaliser cela je me sers de différents outils logiciels au premier rang duquel Excel. C’est un outil que de nombreux professionnels connaissent et utilisent. Malgré des limites, il permet quand même de faire pas mal de choses quand on sait bien l’utiliser.  La plupart du temps je transforme des fichiers Excel de diverses origines pour les traiter dans un logiciel statistique qui s’appelle R. Cela me permet de manipuler des données sur de plus gros volumes, de créer des algorithmes et d’utiliser des méthodes statistiques beaucoup plus avancées. Enfin dans la transmission et la visualisation nous utilisons à la fédération Power BI, qui nous permet de mieux faire passer les messages, d’uniformiser nos rapports d’analyse. L’avantage est de pouvoir personnaliser les choses, nous essayons toujours de proposer de nouvelles représentations graphiques même si on essaye de garder un cadre commun. On est toujours dans cette activité exploratoire pour mieux répondre aux questions que l’on peut ou qu’un staff peut se poser.

Un gros chantier actuel est aussi centré sur la mise en relation et l’accessibilité de nos analyses. En relation avec une entreprise, nous sommes en train de finaliser la construction de bases données SQL. L’une des difficultés que nous avons s’incarne dans la multitude de données GPS qui nous proviennent d’outils différents. Il y a donc un petit challenge à arriver à structurer tout cela.

Quelles sont tes relations avec les coachs ? avec les joueurs ?

C’est très important d’être en relation avec les coachs. La finalité de mon travail est justement de leur apporter des infos. Du coup, il faut constamment être en échange avec eux mais aussi avec les préparateurs physiques, les sport scientist ou encore avec les analystes vidéos avec qui je travaille beaucoup.

Il faut donc essayer de comprendre au mieux les problématiques des coachs, de produire des analyses qui vont faire sens et qui puissent leur servir pour la suite. Le but est bien de faire des études qui serviront sur le terrain au final. Je vais donc régulièrement sur le terrain que ce soit pour monitorer avec les GPS ou simplement pour observer les entrainements de manière à mieux comprendre dans quels environnements mes interlocuteurs travaillent. Par contre je n’ai pas d’interaction directe avec les joueurs. Certaines parties de mes analyses peuvent leurs être présentées mais ce n’est pas mon rôle.

On perçoit nettement, notamment dans les milieux anglo-saxons, que ce métier de Data Scientist se développe très fortement. Qu’en est-il en France ?

Effectivement, on voit, notamment en Angleterre, que ce métier est assez développé mais les Data scientist, dans le sport en France, restent encore peu nombreux. Cela commence un peu dans le Football. Dans le rugby, à ma connaissance, je suis le seul en France, à avoir cette formation statistique de Data scientist. Aujourd’hui dans les clubs ce sont les Sport Scientist qui utilisent plutôt les données. Ils doivent alors construire des compétences qu’ils n’ont pas forcément eu pendant leur formation, une valence plus technologique. Au sein de la fédération, j’essaye de les accompagner, de les former un peu, de leur présenter les meilleurs outils pour les aider dans leurs process.

Je vais régulièrement dans des conférences ou simplement discuter avec des personnes en France ou à l’étranger dans le milieu de la data et c’est vrai que s’est souvent dans le Football que s’est le plus développé. Je pense que cela viendra par la suite dans le rugby.

Dans tes deux dernières interventions, tu as fait une nette différence entre le data scientist et le sport scientist, peux-tu tenter de nous éclairer un peu plus en la matière.

Les sport scientist sont le plus souvent issues des formation STAPS. Ils sont donc plus avisés en ce qui concerne le versant sportif. Certains sont des supers conseillers scientifiques, réalisant des veilles scientifiques, ils construisent une stratégie générale en matière physiologique, nutritionnel voir sur le sommeil. D’autres, plus nombreux, ont des profils un peu plus préparateurs physiques. Mais généralement, ils n’ont pas forcément les compétences dans l’exploitation des données, que ce soit le codage ou l’utilisation de base de données comme on a pu l’évoquer précédemment. De ce fait, il est plus difficile pour eux d’avoir ce travail exploratoire. Je connais plusieurs sport scientist qui sont en train de se développer pour avoir ces connaissances mais ce n’est pas quelque chose d’innée dans leur formation initiale.

A l’inverse, je ne viens pas personnellement du milieu du sport mais depuis quatre ans je commence à en être bien imprégné et à mieux comprendre les problématiques. C’est cette interaction entre les deux, notamment à la fédération, qui est hyper intéressante : nous nous enrichissons mutuellement au sein du département d’accompagnement de la performance.