Les risques hospitaliers sont mal connus et effraient toujours, peut-être à cause du manque de communication des instances hospitalières. Ne parle-t-on pas de 10 000 morts par an dus aux infections nosocomiales ? Ne parle-t-on pas de dix décès possibles quand une panne d'électricité survient ?
A côté de cela, au quotidien, les hôpitaux sauvent des milliers de personnes et réalisent souvent des prouesses en technologie. La tentation était donc grande d'essayer d'évaluer les risques hospitaliers et de classer les établissements selon leur efficacité. Il peut être légitime pour un patient d'apprécier le danger d'une intervention, encore faut-il que l'étude du risque ne soit pas elle-même source de danger.
Les statistiques font partie de la culture anglo-saxonne. Aux Etats-Unis, tous les amateurs de baseball connaissent le batting average de leurs champions préférés. Les bulletins météorologiques annoncent non pas la pluie ou le beau temps mais une probabilité d'averses de x %. Les résultats des sondages apparaissent toujours avec un intervalle de confiance. Les raisonnements probabilistes sont familiers aux lecteurs des journaux, qui publient régulièrement des listes comparatives de risques d'accident selon que l'on utilise tel type de voiture ou que l'on est passager de telle compagnie aérienne.
En France, peut-être en raison de la forte imprégnation cartésienne de notre culture, nous préférons l'exactitude à l'indétermination inhérente à toute approche probabiliste, et les statistiques sont elles mêmes considérées dans la communauté scientifique comme un parent pauvre des probabilités. Les statistiques ne font pas partie du bagage culturel dispensé par l'enseignement secondaire. Seuls les élèves des terminales ES (sciences économiques et sociales) y sont initiés. La conséquence en est que le français moyen ne sait pas tirer les conclusions correctes des faits statistiques. S'il lit dans le journal que la moyenne des salaires de sa catégorie socioprofessionnelle est supérieure au sien, il en conclut qu'il est mal payé. Si la cote d'un homme politique baisse de trois points, l'opinion publique infère que ça va mal pour lui, alors que la marge d'erreur est de l'ordre de quatre ou cinq. Pour la grande majorité de nos compatriotes, un chiffre ne peut être qu'exact et n'est entaché d'aucune indétermination.
Un exemple frappant est donné par un article récent, et qui a fait grand bruit, sur les hôpitaux (1).
Cet article vise à classer les hôpitaux selon trois critères :
- l'activité (mesurée par le nombre d'interventions),
- la notoriété (mesurée par la proportion de patients venant s'y faire opérer depuis un autre département),
- le taux de mortalité pour un type d'opération.
L'article a de grands mérites. Il s'appuie sur les données extrêmement sérieuses provenant de la "médicalisation" du système d'information des hôpitaux, et il tient compte dans sa méthodologie d'un facteur important de mortalité non lié à la qualité des prestations de l'hôpital, à savoir l'âge des patients opérés. On en regrette d'autant plus qu'il ait commis plusieurs erreurs, sans doute d'ailleurs pour être plus accessible à ses lecteurs.
Tout d'abord, les données brutes liées à la mortalité ont disparu. Ne figure dans l'article qu'un "indice de mortalité", calculé pour chaque hôpital et chaque type d'intervention par rapport à la mortalité moyenne de la population globale pour un échantillon stratifié par classe d'âge et homogène avec la population des patients opérés dans l'hôpital. La justification théorique d'un tel indice est irréprochable, mais elle masque -peut-être volontairement- la réalité des chiffres. Sans aller jusqu'à la pratique des journaux scientifiques qui, de plus en plus, demandent que l'intégralité des données à la base des articles qu'ils publient soient rendues disponibles sur le web, on peut regretter que le nombre de décès n'ait pas été publié à côté de celui des interventions -d'autant plus que cela aurait eu la grande vertu pédagogique de montrer que la signification de ce nombre devait être relativisée par la considération de l'âge des patients à travers l'indice de mortalité.
Ensuite, pour satisfaire le goût scolaire de nos compatriotes pour les notes et les classements, l'article a attribué une note sur 20 à partir des trois critères. La comparaison multicritères est en soi un problème trop difficile pour qu'aucun statisticien jette la première pierre à l'auteur...
Mais combien de lecteurs se seront-ils rendu compte qu'on pouvait modifier le classement en changeant les poids des différents critères, et que certains hôpitaux resteraient toujours moins bien classés que d'autres quels que soient les poids choisis ?
Enfin -et c'est peut-être là le plus grave reproche que l'on puisse lui faire- ce "palmarès" des hôpitaux est d'une extrême précision -meilleure que 0,1%, un centième de point suffisant à faire perdre une place -alors que le facteur le plus important entrant dans le calcul de la "note", à savoir l'indice de mortalité, qui repose sur une moyenne pondérée, doit au moins être affecté d'un intervalle de confiance, et n'est carrément pas significatif pour les hôpitaux les moins actifs, qui ont à peine plus de dix interventions annuelles. C'est ainsi que le Centre Hospitalier de Méru, dans l'Oise, classé le moins performant en chirurgie digestive, ne présente pas de différence significative avec celui de Briançon, pourtant classé 50ème- le "mieux performant" des moins performants. Tous deux effectuent 12 interventions annuelles, et le premier a un indice de mortalité triple du second. La comparaison statistiquement correcte dans ce cas est non pas une comparaison de moyennes, mais une comparaison de distributions. Aussi peu intuitif que cela paraisse, une telle comparaison montre qu'un résultat de 3 décès sur 12 interventions n'est pas significativement différent de 1 décès sur 12 interventions, et qu'il en est d'ailleurs de même entre les distributions 6 sur 12 et 2 sur 12. En fait, il faudrait aller chercher le cas extrême de 9 décès sur 12 et 3 décès sur 12 (difficile quand même à imaginer en l'occurrence...) pour pouvoir dire à 95% que la différence n'est pas le fait du hasard.
La vérité est qu'il n'est pas possible de discriminer les cinquante hôpitaux de la liste, qui tous ont une activité trop faible et des indices de mortalité trop voisins pour différer significativement. Quant à les classer...
Le bon sens statistique est ce qui manque le plus dans notre pays. Les conséquences en sont potentiellement graves. L'opinion publique peut se laisser manipuler par des chiffres qui n'ont pas de fondement statistique valable, comme on le voit fréquemment pour les effets stochastiques (2) des faibles concentrations de xénobiotiques (3). Pis, les décideurs politiques eux-mêmes sont amenés, pour prévenir des risques trop faibles pour être mesurés (4), à édicter des normes qui vont induire des coûts considérables à partir d'études statistiques que je qualifierai pudiquement d'insuffisantes. Le problème, touchant à notre culture, n'est pas facile à résoudre. Il faudrait au moins systématiser une initiation statistique dans toutes les filières de l'enseignement secondaire. On peut également envisager la création d'une "Commission d'Ethique Statistique" qui conseillerait les gouvernants sur les bases statistiques de leurs décisions, comme d'autres commissions les conseillent déjà sur la bioéthique ou le génie génétique. Mais les médias ont aussi un grand rôle à jouer, à commencer par la presse de vulgarisation scientifique.
Une occasion a été perdue dans la publication du "palmarès 1998" des hôpitaux, souhaitons qu'elle ne le soit plus en 1999.
Jean-Jacques DUBY
Directeur de SUPELEC
1 Le palmarès des hôpitaux, Sciences et Avenir n° 619, Septembre 1998
2 Qui augmentent le risque de développer telle ou telle pathologie.
3 Dénomination savante des polluants produits par l'industrie, du grec xenos et bios : étrangers à la vie
4 Cf. J.J. Duby, Risques réels et risques négligeables, Pour la Science n° 241, Novembre 1997