L'intelligence artificielle peut-elle vraiment diagnostiquer l'insuffisance cardiaque sur un seul battement?
L’intelligence artificielle médicale est-elle poussée par un élan technologique irrésistible qui la mène de succès en succès? On pourrait le penser après cette annonce de chercheurs britanniques. Ils affirment avoir conçu un système capable de diagnostiquer l’insuffisance cardiaque à partir d’un seul battement d’électrocardiogramme.
Leur étude, parue dans le numéro de septembre 2019 de la revue Biomedical signaling processing and control, n’est pas passée inaperçue. Elle a été largement reprise par la presse généraliste et a suscité de nombreux commentaires sur les réseaux sociaux. Certains ont cru y voir une preuve supplémentaire de l’obsolescence programmée du corps médical.
Examinons donc cette étude plus en détail.
INSUFFISANCE CARDIAQUE ET ELECTRO-CARDIOGRAMME: QUELQUES INFORMATIONS MEDICALES PREALABLES
Qu’est-ce que l’insuffisance cardiaque ?
Il s’agit de l’incapacité du coeur à assurer sa fonction. L’insuffisance cardiaque provoque un défaut d’adaptation à l’effort, ce qui se traduit par un essoufflement. Les médecins mesurent la gravité de la maladie selon l’échelle de l’association du coeur de New York (NYHA).
Les causes d’insuffisance cardiaque sont nombreuses. La plus fréquente est la cardiopathie ischémique qui survient après infarctus. L’hypertension artérielle, une anomalie des valves cardiaques, une infection du coeur et bien d’autres maladies encore peuvent en être la cause.
L’examen-clef du diagnostic d’insuffisance cardiaque est l’échographie. Elle permet de voir le fonctionnement du coeur en direct.
Echelle NYHA
Stade I |
Pas de gêne dans la vie courante
|
Stade II |
Dyspnée, palpitations ou fatigue pour des efforts importants de la vie quotidienne ( à partir de 2 étages montés à pied)
|
Stade III |
Dyspnée, palpitations ou fatigue pour des efforts peu intenses de la vie quotidienne ( moins de 2 étages montés à pied)
|
Stade IV |
Dyspnée, palpitations ou fatigue pour des efforts minimes de la vie quotidienne
|
QU’EST-CE QU’UN ELECTROCARDIOGRAMME?
L’électrocardiogramme, ECG en abrégé, enregistre l’activité électrique des cellules du coeur. Celle-ci est à l'origine de la contraction automatique du muscle cardiaque et de la circulation du sang dans l’organisme.
Un exemple d'ECG
L'électrocardiogramme peut revêtir des aspects anormaux dans de nombreuses circonstances. La plupart du temps, il s’agit de maladies cardiaques mais pas toujours. Par exemple, l'ECG peut être modifié par un taux anormal de potassium dans le sang. Dans ce cas, ce n’est pas le coeur qui est malade. Une autre circonstance a fait changer ce taux de potassium ( une insuffisance rénale, une diarrhée abondante, pour ne citer que 2 exemples). Un taux de potassium trop élevé ou trop bas a des effets sur l’activité électrique du coeur. L’ECG modifié témoigne de cet effet et du risque cardiaque qui lui est lié.
Comme on peut s'y attendre, la plupart des maladies cardiaques sont responsables d'ECG anormaux. Dans l'insuffisance cardiaque, l’ECG est anormal dans 90% des cas. Mais les anomalies constatées sont variées; il n’existe pas d’aspect ECG spécifique à l'insuffisance cardiaque. Très probablement parce que l’insuffisance cardiaque est la conséquence d’autres maladies.
Ainsi, dans la pratique quotidienne, lorsqu’un médecin constate un ECG anormal, il peut rarement porter un diagnostic immédiat. Le plus souvent, il doit prescrire des explorations complémentaires, au premier rang desquels l'échocardiographie qui permet de visualiser le fonctionnement du coeur en temps réel.
Le système d’intelligence artificielle développé par les chercheurs est basé sur des réseaux de neurones convolutifs. Il a été entraîné à l’analyse d’électrocardiogrammes avec pour objectif la détection de l’insuffisance cardiaque.
L’entraînement a été fait à partir de 2 bases de données d’électrocardiogrammes disponibles publiquement. Le travail des chercheurs est donc rétrospectif, purement expérimental. Il ne s’agit pas d’une étude effectuée en situation réelle sur de vrais malades.
La première base de données est celle des sujets normaux : 13 femmes et 5 hommes âgés de 20 à 50 ans, soit 18 ECG au total. La deuxième est celle des sujets insuffisants cardiaques: 4 femmes et 11 hommes âgés de 22 à 63 ans, soit 15 personnes au total, toutes porteuses d’insuffisance cardiaque congestive sévère stade III ou IV de la NYHA.
Pour en savoir plus sur l'entraînement de l'intelligence artificielle en médecine, vous pouvez consulter les rubriques de ce blog "COMPRENDRE L'INTELLIGENCE ARTIFICIELLE EN MEDECINE" et "LEXIQUE DE L'IA EN SANTE".
Vous n'aurez pas besoin de ces notions pour la suite de cet article, vous pouvez donc laisser cela pour plus tard.
Déroulement de l’expérience
Avant l’expérience, chaque battement cardiaque a été étiqueté: normal ou insuffisance cardiaque.
Le réseau convolutif a ensuite été entraîné à repérer les différences de morphologie entre les complexes ECG des 2 groupes (ECG « normaux » et ECG « insuffisants cardiaques ») et à les classer correctement comme appartenant à l’un des 2.
DONNEES ETIQUETEES
Les données informatiques utilisées pour entraînement des systèmes d’intelligence artificielle doivent être étiquetées. C'est d'ailleurs l'enjeu essentiel de l'IA médical: disposer de données étiquetées pour entraîner les machines.
Donner une « étiquette » à chaque image, c’est, tout simplement indiquer à quoi elle correspond. Ainsi, le système s'entraîne sur des images dont on connaît déjà la réponse.
Lorsque le résultat est satisfaisant sur données étiquetées, on fait des tests sur des données non étiquetées.
Dans l’expérience qui nous intéresse ici, les chercheurs ont « étiqueté » la partie de la base de données destinée à l’entraînement en indiquant si il s’agissait de tracés normaux ou pathologiques. Lorsque les résultats ont été jugés satisfaisants,ils ont testé le système sur des données non étiquetées.
Résultats de l'expérience
Les résultats sont globalement très bons : seulement 1% de faux positifs dans le groupe normal et 3% de faux négatifs dans le groupe insuffisant cardiaque.
Les chercheurs ont réalisé la même expérience sur des enregistrements de 5 min. (Rappelons qu'une fréquence cardiaque normale se situe entre 60 et 90 battements par minute. Un battement a donc un ordre de grandeur inférieur à la seconde). Sans surprise, ils ont constaté que les performances étaient nettement améliorées par rapport à celles obtenues avec un seul battement.
Discussion des auteurs
Les auteurs décrivent leur système d’IA comme « une nouvelle méthode innovante pour détecter l’insuffisance cardiaque congestive par réseau de neurones convolutif ».
Ils écrivent que leurs résultats « suggèrent qu’un enregistrement ECG bref de 5 min est suffisant pour diagnostiquer correctement une insuffisance cardiaque». Ils ajoutent: « Ce résultat est important car, avec le nombre croissant d’appareils portables d’enregistrement d’ECG (type montre intelligente), la détection de l’insuffisance cardiaque devient possible avec des dispositifs de la vie quotidienne »
COMMENTAIRE DE LA RÉDACTION DE MÉDECINE ET ROBOTIQUE
L’aisance avec laquelle cet article a été relayé par la presse et les réseaux sociaux est déconcertante. L’insuffisance cardiaque n’est pas une maladie qui se diagnostique sur un simple électro-cardiogramme et un électro-cardiogramme ne s’interprète certainement pas sur un seul battement. Si l’intelligence artificielle était réellement parvenue à un tel résultat, cela mériterait quelques explications.
Mais la discussion des auteurs est centrée sur la performance comparée de systèmes d’intelligence artificielle. Elle est essentiellement informatique là où on attendrait un commentaire médical dense et novateur. Tout au contraire, ce commentaire apparaît rare et son argumentation est bien mal étayée. C’est sur cette insuffisance de la discussion médicale que je veux aujourd’hui m’arrêter un moment.
Examinons d’abord les références médicales utilisées par les auteurs pour appuyer leur argumentation. Elles sont au nombre de 2.
La première est un article de synthèse sur le diagnostic de l’insuffisance cardiaque. Le paragraphe consacré à l’électro-électrocardiogramme précise sa place. Un ECG anormal est présent chez 89% des insuffisants cardiaques. Par conséquent, un ECG normal est peu probable dans l’insuffisance cardiaque. Mais l’ECG est peu spécifique, les anomalies constatées à l’ECG peuvent être associés à d’autres maladies du coeur. Comme attendu, cet article consacré à l’insuffisance cardiaque rappelle que l’échocardiographie est le moyen diagnostic de référence.
Le deuxième référence est un travail publié en 2015. Il n’est pas inutile, pour la discussion qui nous occupe, de relever la motivation des chercheurs qui ont organisé cette étude: l’ECG est un examen réalisé en routine pour les patients suspects d’insuffisance cardiaque; mais son rôle dans la prédiction de cette même insuffisance cardiaque n’a pas encore été établi. Elle a été réalisée sur 733 patients suspects d’insuffisance cardiaque. Ses résultats montrent des anomalies variées amenant ses auteurs à conclure que l’ECG anormal peut aider à suspecter une insuffisance cardiaque et à demander des explorations complémentaires.
En dehors de la citation d'un livre généraliste sur l'ECG, il n’y a pas d’autre référence médicale. C’est peu et c’est insuffisant. A aucun moment, on ne cherche à savoir sérieusement si l’insuffisance cardiaque se diagnostique sur un banal ECG.
Ce qui a été fait par les chercheurs est la comparaison des ECG de 2 groupes de patients, l’un de sujets normaux, l’autre de sujets insuffisants cardiaques. Nous l’avons vu plus haut, un ECG anormal est présent dans environ 90% des cas d’insuffisance cardiaque. Il était donc naturel que le système d’IA de nos chercheurs soit capable de détecter des différences entre les 2. Mais l’ECG de l’insuffisant cardiaque peut être anormal de multiples façons. Il n’existe pas d’ECG « typique » de l’insuffisance cardiaque décrit en médecine. Ceci veut dire que si l’on constate un ECG anormal dans la population générale, il n’est pas possible de conclure à une insuffisance cardiaque. On peut juste dire que.. l’ECG est anormal et que la personne est porteuse d’une maladie cardiaque. Le médecin prescrira alors des examens complémentaires pour en savoir plus (prise de sang et échocardiographie en première intention).
Le résultat de cette recherche ne peut donc être pris que pour ce qu’il est, à savoir une étude technique. Elle nous dit que l’intelligence artificielle, pourra, dans un avenir proche, automatiser les interprétations d’ECG. Mais elle ne pourra pas faire dire aux ECG ce qu’ils ne peuvent pas dire!
Ce travail n’a absolument pas la capacité de démontrer quoi que ce soit en matière de diagnostic de l’insuffisance cardiaque. L’article que nous venons d’analyser est le compte-rendu d’un travail scientifique réalisé par des informaticiens. Ils ont obtenu un résultat technique: faire la différence entre un ECG normal et un ECG anormal. Les ECG pathologiques utilisés étant issus d’un groupe de patients insuffisants cardiaques, ils en concluent de façon erronée que l’ECG diagnostique l’insuffisance cardiaque.
Il manque ici de façon évidente un lien entre informaticiens et médecins. L’ECG est un examen de routine mais son interprétation n’est pas toujours simple pour un médecin non cardiologue. Il existe déjà, et de longue date, des interprétations automatiques sur tous les appareils à ECG. Mais elles manquent de fiabilité et sont peu utilisées. L’IA pourrait donc représenter un vrai progrès si elle était capable de nous donner un outil fiable d’analyse automatisée de l’ECG.
Mais seule une coopération entre informaticiens et médecins peut développer des applications réalistes de l’IA. Malheureusement, un certain nombre de chercheurs en IA publient leurs résultats avec l’objectif d’attirer l’attention sur leur travail par un effet d'annonce. Ceci se fait au prix d’une exagération des capacités de la technique. Notre monde hyperconnecté fait le reste. Les articles sont relayés et commentés sur la base du seul titre, sans que personne ou presque n’ait lu l’article en entier et encore moins sa bibliographie.
Cette étude est donc venue s’ajouter à la liste déjà longue des effets d’annonce qui agitent les réseaux sociaux, créent le « buzz » et alimentent l’idée fausse d’une intelligence artificielle toujours plus autonome, prête à remplacer les médecins.
Mais l’informatique -et l’étude que nous venons d’analyser le montre une fois de plus- ne peut pas se substituer à la science médicale. L’intelligence artificielle ne peut donner plus que ce qu’elle a, à savoir des logiciels pour professionnels.
Il faut le souhaiter, l'intelligence artificielle révolutionnera la médecine et la rendra plus performante. Il existe une condition, cependant, pour que la révolution en question, tant annoncée, prenne corps. Elle doit s’appuyer sur la réalité de la médecine, certainement pas sur un corpus médical ré-écrit et revisité...
RÉFÉRENCES
Lien vers l’article commenté
https://www.sciencedirect.com/science/article/pii/S1746809419301776
Lien vers la bibliographie médicale des auteurs de l’article commenté
https://www.ecrjournal.com/articles/diagnosing-hf-experience
https://heart.bmj.com/content/101/Suppl_5/A12.1
Inscrivez-vous au site
Soyez prévenu par email des prochaines mises à jour
Rejoignez les 23 autres membres