12èmes Rencontres R>

Programme > Conférences plénières

disciplinR : modalités d'intervention intra-disciplinaires avec R. Réflexions depuis l'écosystème archeofrag pour l'analyse spatiale des fragmentations archéologiques

Mardi 16 juin - 14h00

Sébastien Plutniak

CNRS, UMR CITERES-LAT Laboratoire archéologie et territoire, Université de Tours

Sébastien Plutniak

L'écosystème R, du fait de sa polyvalence, des facilités offertes pour le prototypage et le développement, et de sa communauté massive et dynamique, offre aujourd'hui des ressources favorables au développement de contributions intra-disciplinaires. C'est le cas, comme en d'autres disciplines, en archéologie. Cette présentation traitera à ce titre du cas de l'écosystème archeofrag. Celui-ci concerne l'analyse des unités spatiales archéologiques (les couches stratigraphiques, par exemple), lorsqu'elle est conduite à partir des relations d'adjacence observées entre fragments provenant de mêmes objets (des relations usuellement appelées remontages). Le travail mené dans ce cadre concerne différents plans de l'activité archéologique, dont :

  • le plan empirique : en outillant un besoin usuel des praticiens et praticiennes, à savoir la nécessité d'analyser les jeux de données de remontages produits dans nombre d'études, en particulier en archéologie préhistorique ;

  • le plan collectif : en incitant à la publication ouverte, en agrégeant et en diffusant un type de données qui, quoique fréquemment produit, reste jusqu'ici particulièrement peu partagé ;

  • le plan méthodologique : en donnant accès à un renouvellement méthodologique dans ce domaine via, d'une part, l'implémentation de la méthode TSAR (pour Topological Study of Archaeological Refitting), qui tire parti des outils de la théorie des graphes (et de la librairie {igraph}) pour analyser la distribution des relations d'adjacence entre fragments et, d'autre part, le recours aux méthodes d'exploration de modèles implémentés dans la plate-forme openMOLE ;

  • le plan théorique: en traitant de problèmes fondamentaux en archéologie, dans la mesure où les formalisations nécessaires pour les aspects précédemment évoqués appellent à des clarifications conceptuelles sur les propriétés des entités élémentaires considérées en archéologie.

L'écosystème archeofrag articule deux outils logiciels complémentaires, distribués sous la forme de deux packages R :

  • {archeofrag}, qui implémente la méthode TSAR et inclue des copies des jeux de données de remontage ayant été publiés par ailleurs ;

  • {archeofrag.gui}, une application à interface graphique qui, à la fois, facilite et accélère l'utilisation d'{archeofrag}, tout en proposant également des fonctionnalités supplémentaires.

Cette initiative présente ainsi la particularité de tirer parti de l'écosystème R pour traiter, de manière articulée, de plusieurs aspects d'une discipline, depuis ceux empiriques et observationnels jusqu'à ceux théoriques et philosophiques. Cette modalité d'intervention intra-disciplinaire s'ajoute à celles illustrées par d'autres initiatives dans le même domaine dont, par exemple, l'ensemble de packages développé par les membres du collectif germanique ISAAKiel (Initiative for Statistical Analysis in Archaeology Kiel) ; ou, encore, de l'écosystème Tesselle, développé par Nicolas Frérebeau à Bordeaux, comprenant six packages articulés. Au-delà de l'archéologie, les développements disciplinaires s'illustrent par les différentes CRAN task views ou par une infrastructure comme Bioconductor. Cette présentation offrira ainsi une opportunité de considérer, plus généralement, les modalités d'intervention intra-disciplinaires au sein de la communauté et de l'écosystème logiciel R.

Sébastien Plutniak, docteur en sociologie, est chargé de recherche au CNRS, UMR CITERES-LAT « Laboratoire archéologie et territoire ». Sociologue et historien des sciences, ainsi qu'archéologue computationnel et préhistorien, ses travaux portent sur les recours aux formalisations en sciences humaines et sociales, archéologie en particulier, dans leurs dimensions tant pratiques, qu'historiques et théoriques. Impliqué dans la promotion des principes d'ouverture et de reproductibilité en archéologie, il est notamment membre fondateur du collectif CAA-FR (Chapitre français de l'organisation « Computer Applications and Quantitative Methods in Archaeology »).


Bien plus qu'un beau graphique: créativité et accessibilité avec {ggplot2}

Mercredi 17 juin - 09h00

Cara Thompson

Building Stories With Data

Cara Thompson

« Waouh, super ton ggplot ! » Reconnaissable à 3 km, le ggplot de base est pratique, mais souvent peu parlant. Et si on combinait nos connaissances, notre créativité, un souci de rendre nos graphiques accessibles, et une petite dose de typographie pour transformer la réaction de nos lecteurs ?

Cette session explorera comment créer un graphique qui parle — et qui continue à faire parler bien après nos présentations — en prenant pour exemple des données du Meilleur Pâtissier (Great British Bake-Off). En suivant un processus itératif, nous verrons comment transformer un graphique — du ggplot de base au visuel prêt à publier, qui raconte une histoire claire. Et qui sait, on pourrait même y glisser un peu d'interactivité et de paramétisation !

Toutes les ressources seront disponibles pour que vous puissiez réutiliser le code pour vos propres projets. Et n'hésitez pas à apporter vos propres visualisations pour en discuter après la présentation — je suis toujours partante pour un défi dataviz !

Consultante en data visualisation, Cara Thompson se spécialise dans l'accompagnement d'équipes de recherches qui cherchent à communiquer leur travail de façon claire à travers la dataviz. Elle habite à Édimbourg, d'où elle contribue régulièrement des talks en ligne pour la communauté R.


Abstraction de graphes causaux

Mercredi 17 juin - 13h30

Emilie Devijver

CNRS - UMR LIG - Université Grenoble Alpes

Emilie Devijver

L’inférence causale offre un fort potentiel pour améliorer la robustesse, l’interprétabilité et la généralisation des modèles d’apprentissage, mais reste difficile à déployer à grande échelle. Au-delà des limites algorithmiques, ces difficultés reflètent des verrous scientifiques liés à la complexité structurelle des systèmes observés : les graphes causaux estimés à partir de données limitées sont souvent volumineux, instables ou partiels.
Dans cet exposé, je présenterai différentes abstractions causales, dans les séries temporelles et dans les données iid. Plutôt que d'apprendre des représentations causales latentes, souvent difficiles à interpréter, je discuterai comment regrouper les variables observées dans des concepts qui font sens. Je discuterai notamment du compromis à faire pour avoir des modèles interprétables mais suffisamment expressifs.

Emilie Devijver est Chargée de Recherche au CNRS au Laboratoire d'Informatique de Grenoble depuis 2017, où elle dirige l'équipe d'apprentissage automatique depuis 2024. Elle a soutenu sa thèse au Laboratoire de Mathématiques d'Orsay en 2015, sous la direction de Pascal Massart et Jean-Michel Poggi, a effectué un postdoctorat de deux ans avec Irène Gijbels, et a soutenu son Habilitation à Diriger des Recherches en 2024. Ses travaux en apprentissage statistique portent sur les données structurées, en apprentissage semi-supervisé, en données fonctionnelles et en inférence causale, et sont portés par différentes applications (santé, science des matériaux, IT).
Elle a travaillé sur la découverte causale [1,2,3], sur le raisonnement causal [4,5], et est à l'origine des graphes causaux temporels résumé [6]. Elle porte une chaire Causalité et Statistique du Cluster MIAI, co-porte l'action Causalit-AI du PEPR IA avec Marianne Clausel et a lancé le groupe de travail ECLAIRE du GdR RADIA avec Pierre-Henri Wuillemin.

[1] Survey and Evaluation of Causal Discovery Methods for Time Series, C. Assaad, E. Devijver, E. Gaussier, JAIR 2022.
[2] A Mixed Noise and constraint-based Approach to Causal Inference in Time Series, K. Assaad, E. Devijver, E. Gaussier, ECMLPKDD 2021.
[3] Causal Discovery from Time Series with Hybrids of Constraint-Based and Noise-Based Algorithms, D. Bystrova, C. Assaad, J. Arbel, E. Devijver, E. Gaussier, W. Thuillier, TMLR 2024.
[4] Identifiability of total effects from abstractions of time series causal graphs, C. Assaad, E. Devijver, E. Gaussier, G. Goessler, A. Meynaoui, UAI 2024.
[5] Complete characterization for adjustment in summary causal graphs of time series, C. Yvernes, E. Devijver, E. Gaussier, UAI 2025.
[6] Discovery of Extended Summary Graphs in Time Series, C. Assaad, E. Devijver, E. Gaussier, UAI 2022.


Plongée dans l’écosystème R

Jeudi 18 juin - 09h00

Maëlle Salmon

ROpenSci, Cynkra

Maëlle Salmon

R, c’est d'la bombe de balle ! J’enfonce évidemment une porte ouverte avec cette phrase à une conférence sur R… Mais vraiment, de la statistique rigoureuse à de magnifiques apps ou sites, avec R on peut tout faire. Et ce d’autant plus que le langage de base s’étend aisément avec des paquets ! Toutefois, comme quand on déménage dans un nouveau pays, au début on peut être paumé·e au-delà de la langue elle-même. Réglementation et coutumes locales, meilleurs cafés pour notre mode de vie, monuments les plus beaux… R c’est pareil, on peut s’y perdre un peu au début : Qui contrôle le langage ? Où trouve-t-on les meilleurs paquets ? Comment se faire des ami·e·s ? À quoi sert rOpenSci ? Et tant d’autres questions… J’aimerais faire de cette présentation un atlas commenté pour aider tout·e un·e chacun·e à connaître les bons plans, ou à découvrir des joyaux cachés !

Maëlle Salmon, docteure en statistique, est experte en développement de paquets R, blogueuse et conférencière expérimentée. Chez rOpenSci, elle tient à jour le guide rOpenSci Packages: Development, Maintenance, and Peer Review (Packages rOpenSci : développement, maintenance et évaluation par les pairs) et a développé les packages babeldown et babelquarto pour les documents multilingues. Chez cynkra, elle contribue notamment aux packages fledge et igraph. Maëlle est également co-auteure du livre HTTP testing in R avec Scott Chamberlain et gère le blog R-hub. De plus, elle travaille régulièrement pour diverses organisations, notamment des instituts de recherche, pour le développement de paquets R. Maëlle est éditrice pour le système rOpenSci de revue de paquets, membre de l'équipe R-Ladies+ Global, et membre du comité de pilotage des Rencontres R.


Décrypter le rôle de la biodiversité pour le fonctionnement des écosystèmes: complémentarité, redondance, et les outils R pour une écologie reproductible

Jeudi 18 juin - 11h00

Alain Danet

INRAE - UMR DECOD

Alain Danet

Les écosystèmes, d'une complexité fascinante, ont généralement une productivité et une stabilité qui augmentent avec leur biodiversité. Pourquoi ? Je décrypte avec vous deux mécanismes clés : la complémentarité (qui booste la productivité) et la redondance (qui assure la stabilité). Face aux pressions humaines et au changement climatique, il est crucial de produire des connaissances solides sur la manière dont la biodiversité et les écosystèmes sont altérés. Je vous montrerai comment R et son écosystème – à travers l'analyse de données massives, la modélisation et la visualisation – sont des alliés indispensables pour une écologie reproductible et ouverte, capable d'éclairer les décisions dans un contexte de tension sur les enjeux environnementaux.

Je suis chercheur à l'INRAE depuis un an, au sein de l'unité DECOD à Rennes. Mes intérêts de recherche portent sur la compréhension de la structure de la biodiversité et son rôle dans l'apparition de propriétés émergentes à l'échelle des écosystèmes, comme leur productivité et leur stabilité face aux perturbations. Je les étudie avec des approches expérimentales in-situ, d'analyses de large bases de données, et de simulations numériques d'écosystèmes. Pour mes recherches, j'utilise R et Julia comme langages de programmation, neovim pour scripter, Git pour le versionnage, des R compendiums pour bien organiser et R targets pour des pipelines efficaces. Je suis également membre du conseil d'administration de la Société Française d'Écologie et d'Évolution en tant que trésorier adjoint (2025-, secrétaire adjoint 2021-25).

Chargement... Chargement...