Le big data en santé

Résumé

Des voix se font entendre aujourd’hui, amplifiées par le développement de l’intelligence artificielle, pour exiger une amélioration du système d’accès aux données de santé à caractère personnel ainsi que leur ouverture. Il s’agit donc de faire un bilan de la richesse des bases de données de santé, qui constituent le big data en santé, auxquelles il n’est pas toujours facile d’accéder. En effet, les mégadonnées de santé sont des regroupements de traitement de données de santé à caractère personnel et les projets qui les réutilisent, notamment à des fins de recherche, sont également des traitements de données de santé à caractère personnel. Cet ensemble est soumis au droit de la protection des données à caractère personnel.

L’étude des efforts de structuration du patrimoine des données en santé est nécessaire. La France centralise un grand nombre de données issues des activités de soins prises en charge par la Sécurité sociale : les données des soins de ville sont regroupées au sein du Système national d’information inter-régimes de l’Assurance maladie (SNIIRAM) tandis que celles relatives aux soins hospitaliers sont disponibles dans le Programme de médicalisation des systèmes d’information (PMSI). En raison de leur contenu organisé, ces deux bases de données sont les pièces maîtresses du Système national des données de santé (SNDS) créé en 2016. Le SNDS est une mégabase de données diverses, dont le périmètre couvre, depuis son élargissement en 2019 la quasi-totalité des données produites par les acteurs intervenant dans les activités prises en charge par la Sécurité sociale, mise en œuvre par la Caisse nationale d’assurance maladie (CNAM) et la Plateforme des données de santé. Le SNDS, s’il centralise un grand nombre de données n’est cependant pas exhaustif, notamment en raison de la fragmentation du patrimoine des données de santé en France. En effet, les données cliniques ne sont pas remontées systématiquement au sein d’une structure unique, rendant l’alimentation du SNDS délicate. Toutefois, des initiatives locales, telles que la constitution d’entrepôts de données de santé, ou nationales, à l’image de projets couvrant certains aspects du parcours de soin des usagers du système de santé, visent à structurer les données.

Une fois ce panorama du patrimoine des données de santé en France réalisé, il convient d’analyser les conditions d’accès à cette richesse. En effet, le big data a un intérêt, lorsqu’il est possible d’obtenir communication des données, notamment afin de les réutiliser pour réaliser des recherches qui visent à améliorer le système de santé. Toutefois, en raison de la sensibilité des données de santé et en application des règles générales relatives aux traitements de données à caractère personnel, l’accès aux données massives est restreint. La conciliation de ces exigences avec la nécessité de réutiliser les données engendre de lourdes procédures qui doivent être suivies à la fois par les structures qui mettent en œuvre des traitements qui alimentent le big data ainsi que par celles qui souhaitent réutiliser les données issues de tels traitements. Les acteurs du domaine ont conscience de ces difficultés. Afin d’y remédier, des tentatives d’amélioration de l’accès aux données et d’accompagnement des producteurs et utilisateurs des données voient le jour.

Si l’ensemble l’application le droit de la protection des données à caractère personnel est favorable au développement du big data en santé et à sa réutilisation, il se traduit en pratique par des lourdes procédures administratives contraignantes et ne semble pas garantir la transparence de ces traitements vis-à-vis de ceux qui sont à la source des données tant convoitées : les usagers du système de santé.

This entry was posted in . Bookmark the permalink.