La carte & sa pratique

Cartographie dans la recherche scientifique en SHS


Hugues Pecout
Elina Marveaux
UMR8504 Géographie-cités, CNRS

Centre National de la Recherche Scientifique

Le CNRS est le plus grand organisme public français de recherche scientifique.

C’est un établissement public à caractère scientifique et technologique (EPST) placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.

Son activité scientifique est organisée en dix instituts nationaux spécialisés dans différents domaines :

  • Sciences humaines et sociales
  • Biologie
  • Chimie
  • Ecologie et environnement
  • Sciences informatiques
  • Sciences de l’ingénierie et des systèmes
  • Mathématiques
  • Physique
  • Physique nucléaire et des particules
  • Sciences de l’univers

Ces dix instituts sont à la tête d’environ un millier d’unités ou « laboratoires » et de services labellisés, dont la plupart sont gérés en cotutelle avec d’autres structures (universités, autres EPST, grandes écoles, industries, etc.).

Géomaticien·ne au CNRS

▶️ Ingénieur·e en science de l’information géographique

  • Création et collecte d’Info. Géo.
  • Gestion et traitement de données
  • Analyse statistique et spatiale
  • Représentation graphique et cartographie
  • Valorisation et diffusion



Différentes compétences, données et domaines disciplinaires :

  • Opérer sur l’ensemble de la chaine de traitement, en s’adaptant aux besoins/demandes des chercheurs (formation)…
  • Données conventionnelles, image satellite, relevé GPS/capteur, plan historique, recensement, données issue du web…
  • En géographie (humaine et physique), archéologie, écologie, histoire, épidémiologie…

Géomaticien·ne au CNRS

▶️ Un métier à deux facettes :

Une fonction support…

  • Au service des chercheur·euse·s
  • Apporte des compétences techniques
  • Apporte d’une expertise métier
  • Trouve les méthodes et solutions techniques

… qui contient certaines libertés :

  • Spécialisation méthodologique, outils et thématiques
  • Veille technologique, formation continue, insertion dans des réseaux professionnels
  • Liberté d’initiative : coordination de projets, d’évènements… (Selon sa direction)
  • Cumul d’activité possible (ex: enseignement à l’université, cartographie freelance…)

Parcours               ▶️FormationMaster CarthageoCDDFonctionnaire titulaire

Hugues

Elina

2007 [Licence de géographie (Paris 1)]{.col2}
2008 [MASTER I de géographie (Paris 1)]{.col2}
2009 [**MASTER II Carthagéo** (Paris 1)]{.col1}
2010 [Stage]{.col1} puis [CDD - OPH Lille Métropole Habitat]{.col3}
2011 Année sabbatique
2012 [CDD - IE CNRS,  GIS CIST]{.col3}
2013 [CDD - IE CNRS,  GIS CIST]{.col3} [Licence Beaux art (Paris 1)]{.col2}
2014 [CDD - IE CNRS,  GIS CIST]{.col3} [Licence Beaux art (Paris 1)]{.col2}
2015 [Titularisation (Concours CNRS)]{.col4} [Licence Beaux art (Paris 1)]{.col2}
2016 [IE CNRS, FR CIST]{.col4} [MASTER I Beaux art (Paris 1)]{.col2}
2017 [IE CNRS, FR CIST]{.col4} [Licence de géographie (Paris Cité)]{.col2} + [stage à l’UAR RIATE]{.col1}
2018 [IE CNRS, FR CIST]{.col4} [Licence de géographie (Paris Cité)]{.col2}
2019 [IE CNRS, FR CIST]{.col4} [Licence de géographie (Paris Cité)]{.col2}
2020 [IE CNRS, FR CIST]{.col4} [MASTER I Carthagéo (Paris Cité)]{.col1}
2021 [IE CNRS, FR CIST]{.col4} [**MASTER II Carthagéo** (Paris Cité)]{.col1}
2022 [IE CNRS, UMR Géographie-Cités]{.col4} [Stage]{.col1} puis [CDD - IE CNRS, FR CIST]{.col3}
2023 [IE CNRS, UMR Géographie-Cités]{.col4} [CDD, IE CNRS, FR CIST]{.col3}
2024 [IE CNRS, UMR Géographie-Cités]{.col4} [CDD, IE CNRS, Géographie-Cités]{.col3}
2025 [IE CNRS, UMR Géographie-Cités]{.col4} [CDD, IE CNRS, Géographie-Cités]{.col3}
2026 Ingénieur de recherche ? Titularisation ?

Profil actuel

▶️ Unités de rattachement :

  • Collège international edes sciences territoriales (FR 2007)
  • Puis Géographie-cités (UMR 8504)

▶️ Domaine disciplinaire :

  • Géographie humaine (et quantitative)

▶️ Spécialisations techniques :

  • Analyse statistique, analyse spatiale, représentation graphique et cartographie
  • Info. géo. vectorielle, données d’enquête et de recensement et données du Web 2/3.0
  • Principaux outils : Langage de programmation + notebooks & forge logiciel

Spécialisation dans la pratique de R

Dans un contexte de science ouverte et reproductible

▶️ Utilisation du langage R

  • Adapté aux pratiques des collègues
  • Partage et mise à disposition du code
  • Transparence et reproductibilité du travail
  • Gain en productivité, visibilité et polyvalence !


▶️ Outils libres (ou gratuits) :

  • Gestion de version (VCS) : Git (GitLab, GitHub, codeberg…)
  • Notebook : Quarto, Rmarkdwon, Jupyter…
  • DAO : Inkscape, Adobe Illustrator 😬…
  • Et aussi : pgAdmin, Docker, Mapshaper, ScapeToad…

Spécialisation dans la pratique de R

Dans un contexte de science ouverte et reproductible

▶️ Pratique importante des notebooks

  • Outil Rmarkdown, jupyter, Observable, Quarto
  • Pratique de la programmation lettrée
  • Format article, diaporama, manuel, site web…
  • Publication, support de formation, valorisation


▶️ Utilisation des forges logicielles

  • Logiciel de gestion de version (VCS) : Git
  • Forges logicielles : GitLab, GiHub, Codeberg
  • Partage, développement collaboratif et diffusion de code
  • Intégration et déploiement continu de notebook (CI/CD)

EX : R + Quarto + GitLab

#----------- Import et calcul d'indicateur ----------#
library(sf)
com <- st_read("data/lot46.gpkg", layer = "commune", quiet = TRUE)

com$DENS <- 1e6 * com$POP / as.numeric(st_area(com))

#------------- Cartographie Statique ----------------#
library(mapsf)
mf_map(x = com)
mf_inset_on(x = "worldmap", pos = "topleft")
mf_worldmap(com); mf_inset_off()
mf_map(x = com, var = c("POPULATION", "DENS"), type = "prop_choro", border = "grey50", lwd = 1, breaks = "q6", pal = "Magenta", leg_val_rnd = c(0,1),  leg_title_cex = c(1.2,1.2), leg_val_cex = c(1,1), leg_pos = c("right", "topright" ), leg_title = c("Nb habitants", "Densité\nde population\n(en hab./km2)"))
mf_title("Répartition de la population des communes du Lot en 2010", cex =1.3)

#------------- Cartographie dynamique -------------#
library(tmap)
tmap_mode("view")
map <- tm_basemap("OpenStreetMap") +
          tm_shape(com,  bbox = st_bbox(com)) +
          tm_polygons("DENS", title = "hab./km2)", breaks = c(4,7,15,30,60,120,572), border.col = "grey80", lwd = .5)

Les contextes de mise en application

Du support tech. au transfert de compétences

▶️ Support aux projets de recherche

  • Périmètre, consortium et budget différents
  • Support aux besoins des chercheurs
  • Support sur toute la chaîne de traitement

▶️ Formation, documentation & enseignement

▶️ Projets collaboratifs et réseaux métiers

  • Coordination/participation au projet Rzine
  • Co-animation du groupe d’utilisateur.rice.s ElementR
  • Intervention dans les activités de réseaux métiers

Pratique de la cartographie dans la recherche scientifique

Du contrôle des données à la valorisation des résultats

▶️ Contrôle et exploration de données

  • Données manquantes, aberrantes ? Complétude ?
  • Logiques ou organisations spatiales significatives ?

▶️ Analyse exploratoire et spatiale

  • Confirmation d’une intuition, analyse d’un phénomène
  • Support au travail d’analyse de chercheur·euse·s

▶️ Publication et valorisation

  • Rapport scientifique (livrable de projet de recherche)
  • Communication (et poster) en colloque scientifique
  • Article scientifique et de vulgarisation (presse)
  • Ouvrage, atlas
  • Application cartographique interactive
  • Site web

Cartographie dans le cadre de projets

Pas de réelle spécialisation thématique, mais principalement avec 3 types de sources de données exploitées

  • A. Données conventionnelles (statistiques et découpages institutionnels)
  • B. Données issues du Web (BD et plateforme collaborative, RS, média…)
  • C. Données d’enquête (cartes mentales, représentations et imaginaires)

Cartothèque

A. Cartographie de données conventionnelles

Integrated Territorial Analysis of the Neighbourhoods (ITAN 2012-2014)

Projet Européen ESPON

  • Public cible : décideurs politiques
  • Zone d’étude : 25 pays du voisinage de l’UE
  • Données : statistiques officielles (démo, socio, éco…)
  • Échelle : maillage statistiques infranationaux

Mission :

  • Co-organisation de la collecte
  • Construction de la base de données
  • Ajustement & harmonisation Spatiale et temporelle
  • Création d’indicateurs composites, classifications
  • Cartographie (+ de 120 cartes)

    

    

    

    

    

    

Le contexte géo-économique de l’Ukraine, 2013


Taux de croissance annuel de la population (2000-2010)


 

Répartition de la population de moins de 15 ans, 2010


Ratio de dépendance, 2010


Typologie en fonction des ratio de dépendance, 2010



Indice de potentiel territorial, 2010









         

A. Cartographie de données conventionnelles

Grandes métropoles (2015-2017)

  • Projet : exploratoire, pas de temporalité, 0€ de budget
  • Zone d’étude : grandes métropoles (Paris, Chicago, Mexico)
  • Données : statistiques publics et du web !
  • Échelle : intra-urbaine

Objectifs :

  • Analyse comparative intra-urbaine
  • Interopérabilité et harmonisation de données


Mission :

  • Collecte de données
  • Comparaison de maillages statistiques
  • Harmonisation d’indicateurs/nomenclatures
  • Harmonisation des découpages statistiques
  • Croisement et appariement de données
  • Exploration de méthodes de représentation
  • Communications et articles

Hétérogénéité des découpages statistiques et de la répartition de la population


Différence des découpages statistiques


Population et surface des IRIS, AGEB et BlockGroup


Tentative de recomposition d’un découpage statistique complet pour Mexico


Densité de population à Mexico, 2010

Simplification of spatial units for a comparable global representation: the case of residential mobility in Mexico


Nombre d’habitants cumulée depuis le centre

Anamorphic mapping as a comparative analysis tool

Comparison of Airbnb supply in 2016 and 2- to 6-room apartment sales in 2012

B. Cartographie de données issues d’enquêtes

Imaginaires macro-régionaux et cartes mentales

Deux projets…

  1. GlocalMap (DIME Quanti - panel ELIPSS, 2016-2019)
  2. IMAGEUN (ANR-DFG, 2021-2023)

… avec beaucoup de similarités

  • Objet d’étude : représentations et imaginaires macro-régionaux
  • Données : issues d’enquêtes numériques non-supervisées
    1. panel représentatif de la population française 
    2. étudiants de 5 pays (FR, DE, TN, TR, IR)
  • Caractéristiques communes : collecte de cartes mentales

GlocalMap

Enquête en ligne (tablette) - DIME Quanti, panel ELIPSS

         

         

         

Quel(s) pays souhaiteriez-vous voir sortir / entrer dans l’UE ?

L’imaginaire influencé par la méthode de questionnement…

ANR IMAGEUN

In the Mirror of the European Neighborhood (Policy). Mapping Macro-Regional Imaginations.

Le projet

Thématique

Explorer les imaginaires géographiques relatifs à l’espace européen et son voisinage

Etudier le sentiment d’appartenance d’individus variés à cet espace

Contexte

Projet franco-allemand (ANR-DFG) 2020 - 2024

Cinq pays ciblés : Allemagne, France, Irlande, Tunisie, Turquie


Trois volets :

  • Corpus médiatique
  • Entretiens décideurs politiques
  • Enquête auprès d’étudiants universitaires

Student-Workshop

  • Quoi : interroger les imaginaires macro-régionaux
  • Qui : étudiants de licence 3 au minimum
  • : universités et écoles de trois villes des cinq pays
  • Comment : questionnaire en ligne comportant un carte mentale

Objectifs du stage

Élaborer une chaîne de traitements pour :

  • Explorer & Contrôler
  • Nettoyer & Harmoniser
  • Enrichir
  • Analyser & Valoriser

Objectifs en CDD

  • Participer à la production scientifique (articles)
  • Rédiger un datapaper pour accompagner la publication de la BD
  • Construire un site interactif de valorisation des résultats de recherche (tous corpus)

L’enquête étudiante

3220 Réponses → 2030 après nettoyage

2740 Géométries

Chaîne de traitements (BD)

Chaîne de traitement (cartographie)

Construction de la donnée géographique

Espaces dessinés par un étudiant, reconstruits, re-dessinés, typés, corrigés sous R

Construction de la donnée geo - suite

Construction de cartes lissées

Cartothèque IMAGEUN

Autres sous corpus

Valorisations

Productions papier

Image promotionnelle - Quinze ans de l’ANR-DFG

Poster - Journée des Jeunes chercheurs de l’Institut de Géographie

Articles et communications

Communications en congrès

  • congrès centenaire de l’union Internationale de géographie
  • séminaire portant sur les mondes de l’asie centrale à Tachkent
  • Congrès Allemand de Géographie (DKG) à Francfort.

DataPaper - ANR-DFG IMAGEUN- Enquête étudiante

Productions numériques

Une valorisation finale moderne

C. Cartographie de données issues du Web

ANR Corpus Géomédia (2012-2015)

  • Objet d’étude : Actualité internationale (numérique)
  • Données : Flux RSS, un item = un article
  • Échelle : Internationale (limitation langue)


Mission :

  • Collecte automatisée de flux RSS (Corpus de +20M d’items)
  • Détection d’entités géographiques nommées
  • Base de données tridimensionnelle (média, pays, date)
  • Modélisation - détection d’évènements
  • Cartographie !

Nombre de Flux RSS collectés par pays et par langue utilisée, 2015



Nombre d’items collectés par jour et par flux (2014-2015)


Contrôle de la collecte (Ex : New-York Times, flux international)

    

Détection d’entités nommées (géographiques & évènements)


Contrôle de l’enrichissement spatial et thématique des items RSS (ex: NYT, flux int.) :

Base de données tridimensionnelle : le cube géo-médiatique


Création de sous-corpus les plus homogènes possible


“Une analyse géomédiatique de l’actualité internationale : hiérarchies et effets de voisinage” https://doi.org/10.3917/eg.452.0124


Citation “Ebola” par média


Co-citation pays + “Ebola”

    






Détection d’évènements géo-médiatiques : Geomedia Event Xplorer

C. Cartographie de données issues du Web

Projet DEEZER Drom & BASS

Dataset : 4 séries de 4 jours d’écoute par an pendant 4 ans :

Une base de données d’écoute structurée et spatialisée par Géographie-cités :

  • 4 jours : samedi, dimanche, lundi et mardi ~ mi juin
  • 4 années : 2020, 2021, 2022, 2023

* Utilisateurs ayant écouté entre 10 et 1000 morceaux au cours de la période des 16 jours,
soit la grande majorité (> 80% du total des usagers Deezer)

Territoires ciblés : 5 DROM Martinique - Guadeloupe - Guyane - La Réunion - Mayotte

Dataset Deezer

Localiser les données du web

Affecter des streams à des maillages territoriaux

Objectifs
- comparer les écoutes entre DROM - compatibilité avec d’autres bases de données - mobiliser des maillages familiers pour l’analyse cartographique


Contraintes

  • échelons emboîtés
  • communs aux DROM
  • comparables entre DROM
  • élaborer une méthode systématique d’assignation

Processus d’affectation

Caractériser les proximités d’écoutes

Comparer les territoires entre eux

Comparer à d’autres données

C. Cartographie de données issues du Web

Réseaux sociaux, BD collaboratives (API) et Web scraping…

Autres exemple de projets :


Caractèristiques communes :

  • Gros volume de données issues du web (big data)
  • Données hétérogènes : individuelles, géographiques, textuelles…
  • Exploration et contrôle important
  • Travail de structuration et de nettoyage important

    
    
    
    
    


    


    
    

Accessibilité aux maternités(2000-2018)

https://rcarto.gitpages.huma-num.fr/santelocal/

Extraction du réseau routier français (OpenStreetMap)

Récupération des adresses, niveaux et états des maternités (Femme Actuelle)



Accessibilité aux Hôpitaux (2000-2018)

https://rysebaert.gitpages.huma-num.fr/santechir/index.html

Localisation des établissements disposant de places et lits en chirurgie en 2000 et 2018

metal-archives.com


Evolution du nombre de groupes actifs par pays (1964-2014)


Evolution du nombre de groupes actifs et nombre de pays concernés (1964-2014)


Nombre de groupes par genre (1964-2014)


Spécificité pays et genre

    


Analyse de réseau (label, groupe, artiste, pays…)

    

Au delà de l’analyse et de la cartographie des données…


  • Participation à la valorisation des résultats (communications, articles…)
  • Travail de veille scientifique (réseaux métiers, formations…)
  • Participation à l’organisation d’événements (colloques, écoles thématiques…)
  • Transferts de compétences (formations et enseignements)


Exemple : École d’été du CIST 2023

« Méthodes et outils des sciences des territoires,
une perspective Nord-Sud, Sud-Nord, Sud-Sud »

Ecole d’été du CIST 2023

Merci de votre attention


Diapositives libres (CC BY-SA 4.0)

Diaporama : https://hpecout.gitpages.huma-num.fr/m1_carte_et_pratique/
Code source : https://gitlab.huma-num.fr/hpecout/m1_carte_et_pratique


Contact

Questions ?