Les missions du poste

Établissement : Université Grenoble Alpes École doctorale : MSTII - Mathématiques, Sciences et technologies de l'information, Informatique Laboratoire de recherche : Laboratoire d'Informatique de Grenoble Direction de la thèse : Marlène VILLANOVA ORCID 0000000272426102 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-22T23:59:59 Les bases de données géographiques telles qu'OpenStreetMap (OSM) et la BD Topo de l'IGN évoluent continuellement pour représenter les transformations du territoire. Identifier, décrire et qualifier les changements que ces bases de données géographiques subissent au cours du temps est un enjeu majeur pour l'analyse des évolutions des territoires dans le temps.

Cette thèse s'inscrit dans le cadre du projet ANR GEvoK (Geographic entities Evolution in Knowledge graphs) qui vise à la détection et annotation sémantique automatique des changements géographiques dans des données de sources diverses (satellitaires ou collaboratives comme celles d'Open Street Map par exemple).

L'approche consiste à combiner des techniques d'intelligence artificielle (IA) pour la détection automatique des changements au cours du temps, des technologies du Web sémantique pour la représentation et l'enrichissement des connaissances issues de cette détection et enfin des LLM pour l'interrogation des bases de connaissances produites et la restitution de récits décrivant les changements en langue naturelle. Les sociétés humaines ont recours à l'information géographique pour décrire les éléments d'intérêt (EI) physiques (e.g., une école, une route, une piste cyclable) ou virtuels (e.g., un zonage administratif), constitutifs de leur territoire. Dans le domaine de l'information géographique, la représentation de ces éléments est bien maîtrisée. Cependant, la représentation et la contextualisation des changements que ces éléments subissent au fil du temps, sous l'effet, par exemple, de politiques de transition des villes vers des modes de transports faiblement carbonés, sont des phénomènes complexes dont la représentation constitue un défi. Ces phénomènes complexes, aussi appelés transformations territoriales ou changements territoriaux, impliquent un ou plusieurs EI qui varient à un instant ou lors d'une période de temps identifiée, sous l'effet de pressions diverses. Aujourd'hui, la documentation de ces transformations territoriales sous une forme exploitable par des programmes informatiques est quasiment inexistante.
Dans le domaine de l'analyse des villes, des Bases de Données (BD) géographiques rendent compte - via le recours à des standards (e.g., CityGML) ou non - du bâti des villes, de leurs réseaux de transports, ou de tout autre aménagement urbain qui les composent. Certaines de ces BD ouvertes et collaboratives, comme OSM (OpenStreetMap), sont parfois plus à jour que les BD officielles, du fait de contributions continues. Elles rendent ainsi compte indirectement des évolutions des éléments composant la ville. Un projet plus marginal, nommé OHM (OpenHistoricalMap) , consiste à créer avec les outils OSM une carte historique open source modifiable par tout utilisateur. Cependant, aucune de ces BD ou standards ne prévoit une documentation des changements subis par les EI de ces territoires (e.g., réseaux de transports en commun, rues, pistes cyclables, etc.). Un différentiel est parfois disponible entre deux millésimes de données, comme c'est le cas dans la BD Topo de l'IGN, mais ces différentiels ne qualifient pas et ne quantifient pas les changements survenus. Ainsi, le suivi de l'évolution des villes est complexe en raison de l'absence de standards pour représenter les transformations urbaines. Pourtant, l'adoption d'un vocabulaire commun pour la description de changements urbains permettrait de quantifier les changements selon leur type, de définir des indicateurs révélateurs des changements des zones urbaines, facilitant ainsi la comparaison entre villes aux trajectoires similaires ou divergentes.
Face à ces premiers constats d'absence de données décrivant des changements territoriaux, et à l'absence d'outils pour la description harmonisée de ces changements dans le domaine de l'aménagement du territoire et du suivi de l'évolution de la couverture du sol, l'objectif de cette thèse est d'automatiser la détection et la description de changements territoriaux, puis de constituer des suites chronologiques de ces changements afin de rendre compte de trajectoires territoriales. La définition de ces catalogues de changements favorisera l'interopérabilité entre les systèmes et posera les bases nécessaires à une adoption de l'approche par diverses communautés. Ces catalogues prendront la forme de graphes de connaissances spatio-temporelles (Spatiotemporal Knowledge Graphs ou ST-KGs) ouverts et conformes aux principes FAIR (Findable, Accessible, Interoperable, Reusable), garantissant ainsi leur accessibilité et réutilisation, notamment par des jumeaux numériques des territoires ou des programmes d'IA prédictive estimant les orientations futures des territoires à partir des connaissances historiques produites. Afin de créer ces données FAIR retraçant l'histoire des territoires, les technologies du Web sémantique et les KGs sont une solution pertinente. Ces derniers structurent les données en noeuds reliés par des arêtes sémantiques, idéales pour représenter les liens spatiaux, temporels et de filiation entre les EI.
De plus, les KGs immergés dans le Web des Données Ouvertes et Liées (LOD) offrent des possibilités d'enrichissement dynamique, renforçant ainsi leur expressivité et leur utilité pour l'analyse des changements territoriaux. L'enrichissement des EI passe par leur connexion à d'autres KGs tels que Wikidata, fournissant des informations encyclopédiques. Les logiques de description et les ontologies permettent d'inférer des liens implicites, améliorant la complétude des connaissances. De plus, l'intégration des KGs aux Large Language Models (LLM) ouvre de nouvelles perspectives d'enrichissement et d'interaction. D'une part, les LLM peuvent extraire et structurer des informations issues de corpus textuels. D'autre part, cette synergie facilite l'interrogation des KGs, en permettant aux utilisateurs de formuler des requêtes en langue naturelle pour interagir avec des données spatio-temporelles complexes. Cette avancée démocratise l'accès aux KGs et favorise le développement d'applications intelligentes capables de traiter des requêtes sophistiquées en combinant raisonnement symbolique et compréhension de langue naturelle.

Le profil recherché

Le candidat doit être titulaire d'un master en Informatique, Géomatique, Intelligence Artificielle ou Systèmes d'Information ;
- Solides connaissances en Python et en apprentissage automatique (classification, détection d'anomalies, clustering) ;
- Connaissances dans le domaine du Web sémantique et la représentation des connaissances (RDF, OWL, SPARQL) ;
- Notions en traitement de données géographiques ; Connaissances de QGIS et des formats de données spatiales (GeoJSON, shapefile, etc.) ;
- Autonomie, rigueur, capacité d'analyse et appétence pour les approches hybrides IA / géomatique.

Niveau de français requis : Intermédiaire supérieur (B2)

Niveau d'anglais requis : Intermédiaire supérieur (B2)

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

L’emploi par métier dans le domaine Data et IA à Grenoble