Développement et validation d’outils d’intelligence artificielle pour pleinement exploiter le potentiel des entrepôts de données de santé dans le domaine de la neuroimagerie

Résumé de soumission

Les entrepôts de données de santés (EDS) stockent et organisent un large éventail de données cliniques au sein d’un institut de soin (hôpital, groupement d’hôpitaux). En France, de nombreux EDS ont été créés (par exemple l’EDS AP-HP – Assistance Publique – Hôpitaux de Paris, l’EDS INCLUDE à Lille, Amiens-Picardie, Caen-Normandie et Rouen-Normandie, l’EDS de l’hôpital universitaire de Rennes…). Les EDS offrent de formidables opportunités pour la recherche en raison de leurs caractéristiques uniques. En particulier, ils fournissent des données à très grande échelle rassemblant jusqu’à des millions de patients et constituent une source unique de données en « vie réelle ». Toutefois, l’exploitation des EDS à des fins de recherche soulève des défis majeurs. Parmi ces défis, la qualité et l’hétérogénéité des données ont été signalées comme étant d’une importance capitale par un récent rapport de la Haute Autorité de Santé.
 
La neuroimagerie offre une fenêtre unique sur le cerveau vivant, permettant d’étudier l’intégrité de sa structure et de sa fonction. L’exploitation des données de neuroimagerie provenant des EDS peut donc conduire à des avancées majeures, notamment une meilleure compréhension du développement et du vieillissement du cerveau, qu’il soit sain ou pathologique, et le développement d’outils de diagnostic assistés par ordinateur qui pourraient démocratiser l’accès à des évaluations neuroradiologiques de pointe. Cependant, la question de la qualité et de l’hétérogénéité des données est particulièrement problématique dans le domaine de la neuroimagerie et en particulier de l’IRM cérébrale.
 
Par conséquent, les données de neuroimagerie des EDS sont une « mine d’or » potentielle qui est actuellement sous-exploitée. Pour exploiter pleinement ce potentiel, il faut de nouveaux outils capables de contrôler la qualité des données et les biais potentiels. La volumétrie très importante rend un contrôle qualité visuel impracticable d’où le besoin d’outils automatiques utilisant l’intelligence artificielle. En outre, le développement d’outils pour le diagnostic assisté par ordinateur nécessite un changement de paradigme, car les approches actuelles sont principalement développées à partir de données de recherche et ne peuvent pas faire face de manière adéquate à l’hétérogénéité des données de routine clinique.
 
Nous avons réalisé des travaux pionniers dans le domaine de la qualité et de l’harmonisation des données pour l’IRM cérébrale dans les EDS. Nous avons mis au point le premier système automatique de contrôle de la qualité pour l’IRM cérébrale pondérée en T1 dans les EDS. Dans le cas spécifique du diagnostic assisté par ordinateur de la démence, nous avons montré que les modèles d’IA construits à partir de données de recherche généralisent très mal aux données de routine clinique et que, lorsque la qualité des données n’est pas correctement prise en compte, cela conduit au phénomène catastrophique d’apprentissage « par raccourci », où le modèle d’IA apprend à reconnaître la qualité de l’image à la place des caractéristiques radiologiques associées à la pathologie.
 
L’objectif général de ce projet est de développer un ensemble d’outils basés sur l’IA pour exploiter pleinement le potentiel des données de neuroimagerie dans les EDS, de mettre ces outils à la disposition de la communauté de chercheurs et cliniciens et de démontrer qu’ils peuvent être utilisés pour développer des systèmes de diagnostic pour la neuroradiologie assistés par IA fiables et non-biaisés.
Les objectifs spécifiques sont les suivants :
Objectif 1 : construire des outils d’IA pour exploiter les données de neuroimagerie dans les EDS et mettre ces outils à la disposition d’autres chercheurs et cliniciens. Plus précisément, nous proposons de : i) construire des outils de contrôle automatique de la qualité pour les principales séquences utilisées en neuroradiologie clinique ; ii) concevoir des outils de contrôle qualité pour les résultats de post-traitement ; iii) développer de nouvelles approches pour l’harmonisation a posteriori des données IRM provenant des EDS ; iv) mettre ces outils à la disposition d’autres équipes utilisant les données des EDS.
Objectif 2 : construire une preuve de concept d’un système non-biaisé de diagnostic assisté par l’IA pour la neuroradiologie. Nous proposons spécifiquement de construire un système pour aider à la détection et à la caractérisation des zones lésionnelles. Nous émettons l’hypothèse que le paradigme de la détection d’anomalies non supervisée, combiné aux outils de contrôle de qualité et d’harmonisation développés, permettra de surmonter les limites des techniques traditionnelles basées sur la classification, notamment la difficulté d’obtenir des vérité terrain fiables et les problèmes d’apprentissage par raccourci.
Il s’agit d’un projet commun entre des équipes de Paris et de Lille, impliquant deux EDS (AP-HP à Paris, INCLUDE à Lille). Pour assurer la généralisation, tous les outils feront l’objet d’une validation interne sur un EDS et d’une validation externe sur un autre EDS.
 
Ce projet devrait avoir un impact majeur sur différents aspects. Il permettra aux chercheurs d’exploiter pleinement les données de neuroimagerie très riches mais complexes contenues dans les EDS. Cela peut potentiellement conduire à de nouvelles découvertes majeures dans divers domaines tels qu’une meilleure compréhension des facteurs influençant le vieillissement sain et pathologique du cerveau. Il devrait fournir de nouveaux outils d’intelligence artificielle qui pourraient avoir un impact sociétal important en apportant la capacité de détecter des lésions complexes, qui nécessitent une expertise spécifique qui n’est généralement disponible que dans les départements de neuroradiologie spécialisés, à des centres non-experts, réduisant ainsi les inégalités dans l’accès aux soins.

Equipes du projet

Coordonnateur :

COLLIOT Olivier

N° ORCID : 0000-0002-9836-654X

Structure administrative de rattachement : ICM

Laboratoire ou équipe : ICM - Inserm U1127 - CNRS UMR 7225 - Sorbonne Université

N° RNSR : 200918525B


Autres équipes participantes :

Responsable de l'équipe 2 : LEHERICY Stéphane
Service de Neuroradiologie, Hôpital de la Pitié-Salpêtrière, AP-HP


Responsable de l'équipe 3 : LOPES Renaud
Lille Neuroscience & Cognition center, CHU Lille, UMR-S 1172, University of Lille. Team DVCD


Responsable de l'équipe 4 : KUCHCINSKI Gregory
Service de Neuroradiologie, CHU de Lille


Vous êtes porteur/membre du projet et vous souhaitez faire une mise à jour ?

Dites-le nous !




    INSCRIVEZ-VOUS A NOTRE NEWSLETTER