Le codage médical pour tous

 
S
ans nous en rendre compte, toute interaction avec un soignant lors d’une consultation ou d’un séjour hospitalier est non seulement répertoriée mais également classifiée, ou plus précisément codifiée. Et cela pour 2 raisons principales: 
 

  1. le suivi de dossier médical 
  2. la facturation des différents diagnostiques et traitements qui ont été prodigués 

On parle par exemple de T2A (2008) en France  et de TARMED (2002) en Suisse. À chaque diagnostique, traitement ou intervention (chirurgicale) est associé un label, ou code clinique, qui suit une nomenclature imposée. Citons de manière non-exhaustive les classifications CCAMCIM-10CHOP ou DRG. Pour illustration: le codage médical CCAM associé à une “Biopsie de la prostate par voie transpérinéale avec guidage échographique” est JGHJ002. 
 
Les médecins hospitaliers sont particulièrement réfractaires à cette notion de “tarification à l’acte” (voir par exemple cette tribune de mars 2020) car ils y voient une perte de temps pour le soin, une déshumanisation de leur métier et une mesure anxiogène de leurs performances. La direction des hôpitaux, au contraire, y voit non-seulement un outils indispensable de suivi financier mais également de justification vis à vis des assurances maladies qui surveillent attentivement les excès.
 

Exemple d’arbre de décision pour un codage médical CIM-10 (ICD-10 en anglais)

Ces labels sont donc, dans le cas général, déterminés par des experts du domaine: les codeurs médicauxLeur travail consiste à retracer l’histoire du parcours patient en regroupant les documents clefs: notes cliniques, rapports divers ou feuille de sortie puis, à dresser la liste des codes correspondants avec la plus grande précision. C’est un travail extrêmement minutieux nécessitant un haut niveau de compétence: Il existe par exemple plus de 100’000 codes CIM-10 de diagnostique. Le codage peut par ailleurs s’avérer fastidieux dans un contexte où le dossier patient est morcelé entre les différents silos informatiques ou même mélangé avec du papier (c’est encore malheureusement souvent le cas en 2020). En discutant avec les codeurs, on s’aperçoit qu’ils consacrent souvent plus de temps à la recherche documentaire qu’à la codification à proprement parlé. Les outils d’assistance à leur disposition sont des bases de données officielles avec des champs de recherche classiques par mot clef ou des logiciels propriétaires.

 

L’approche IA

Le traitement du langage naturel (natural language processing ou NLP) est l’un des champs les plus développé en intelligence artificielle (IA) en 2020. Cette technologie, actuellement basée sur des réseaux de neurones artificiels, a été propulsée par les GAFAM et constitue le cœur de leurs services en lignes : moteurs de recherche, regroupement de news, recommandations, analyse de commentaires, chatbots, auto-correction… Il s’agit ici d’apprendre à la machine à lire et à écrire, ou plus précisément à encoder et générer des mots et phrases tout en conservant leur contexte sémantique. Vous pouvez par exemple demander à Google, Siri, Alexa “Quel temps fera-t-il demain?”, “quelle est la météo pour demain?” ou encore “donnemoi la météo pour se weekend” avec un résultat tout autant efficace. 
 
La NLP est particulièrement adaptée au codage médical où les notes en texte libre (parfois encore manuscrites) sont pléthore. La liste des applications pour assister les soignants et le personnel administratif est alors considérable . On peut mentionner l’‘analyse et le regroupement de documents par contenu, le pré-remplissage des formulaires, la génération et le résumé de rapports cliniques, les chatbots interactifs et, bien sûrla codification automatisée des actes médicaux. Cette dernière application, qui nous intéresse ici, se résume à une “simple” tâche de classification à choix multiples, une fois les données harmonisées et structurées. Dans le cadre de notre solution mediCAL.ai, nous avons développé chez CALYPS, en collaboration avec des équipes de codeurs, 3 approches pour automatiser ou assister le codage des actes médicaux:
 

  1. l’application “Pré-codage tout automatisé: Il s’agit ici d’interfacer avec le dossier patient informatisé, de rassembler les informations essentielles et de produire des codes pour les nouveaux patients ; le tout mis à jour instantanément dès que de nouvelles informations sont disponibles pour affiner la prédiction. Nous recoupons les données patient générales et les notes cliniques en texte libre et suggérons, grâce à notre algorithme, les codes CIM-10, CHOP et/ou DRG qui en découlent. Il est tout à fait possible de court-circuiter CIM-10 (diagnostique) et CHOP (intervention) en proposant directement un DRG (tarification). Ce module permet en associant le cost-weight – pondération relative décrivant l’investissement en soins pour un groupe de patients donnécalculée chaque année sur la base des données actualisées de coûts par cas des hôpitaux – au code DRG de calculer un tarif anticipé pour chaque patient, ainsi qu’un tarif global pour un ensemble de patients sans intervention humaine.  
     
  2. l’application “Annotation des feuilles de sortie: nous analysons automatiquement une collection de feuilles de sorties structurées (formulaires) ou non (documents scannés) afin d’en extraire automatiquement les zones de diagnostiques et d’interventions. Puis, nous annotons les documents avec les codes pertinents comme le ferait un codeur. C’est un outil qui prépare le travail à l’avance, il suffit alors de valider ou ajuster si besoin. A noter que ce Module 2 s’interface avec le Module 1 sil n’existe pas de dossier patient informatisé et que la lettre de sortie est le document central.
     
  3. l’application “Aide à la saisie intelligente”: cet outil a pour but de donner au personnel effectuant des saisies la possibilité de renseigner sans effort des codes médicaux par simple validation. L’analyse de ces saisies propose en temps réel les codes les plus probables. Cela permet par exemple à une secrétaire de pré-coder une feuille de réservation lors de la prise de rendez-vous, ou à un médecin de coder ses notes cliniques sans empiéter sur son temps de travail. 

 

Illustration des applications 2. et 3.

Nous avons développé 3 approches utiles au codage médical en interagissant avec les professionnels du métier et chaque établissement de santé possède sa propre réalité, ses méthodes de travail et ses ressources humaines. Le niveau de technologie et d’harmonisation des données déterminera sil s’agit d’assister ou d’automatiser. Il demeure cependant clair que la plupart s’inscriront dans le cadre de l’un de ces 3 modules qui offrent un gain de temps ainsi qu’un pouvoir d’anticipation. Dans le cas d’une automatisation complète pour le pré-codage par exemple, il convient qu’un œil expert soit à disposition pour vérifier de temps à autre la pertinence et la stabilité des prédictions de l’algorithme. Cette dernière repose, rappelonsle, sur une vision historique du travail remarquable des codeurs médicaux. 
 

PhD Hugo Flayac pour Calyps 

 
PS: l’annotation des feuilles de sortie est également commentée dans cette démo d’une minute:
 

Vos données ont de la valeur !

La Data Intelligence est destinée aux gestionnaires, décideurs et dirigeants d’entreprise. Il s’agit de la mise en œuvre des moyens, outils et méthodes destinés à fournir l’information utile pour décider et agir en toute connaissance de cause. Mettez-toutes les chances de votre côté en vous appuyant sur des professionnels de la donnée.

Les experts CALYPS sont là pour vous aider