Études de Référence en Thérapeutique Cardio-Vasculaire

Retour au sommaire


> Présentation du résumé standardisé 

Ce résumé standardisé devait avoir un double objectif : a) permettre des "relectures" rapides des résultats des études, avec un accès immédiat à l'information recherchée ; et b) recenser les éléments les plus indispensables à une analyse rigoureuse (le plan du résumé tenant lieu d' "aide-mémoire" au cours de la lecture).

La plupart des études sont présentées en deux faces de page. La première page expose les éléments prévus par le protocole, ainsi que les caractéristiques principales de la population incluse dans l'étude. Ces dernières sont généralement placées dans les résultats, à juste titre, mais d'une part, il est utile pour le lecteur de les lire immédiatement après les critères de sélection, et d'autre part, la place manquait pour l'exposé des autres résultats. La seconde page est réservée à ceux-ci, ainsi qu'aux commentaires qui nous semblent justifiés. Il nous a paru utile d'apporter quelques précisions sur les différents paragraphes qui le composent :

 1) Le nom de l'étude est celui donné par les auteurs eux-mêmes. En cas d'absence de nom précis donné par les auteurs, nous avons individualisé l'étude soit par les traitements comparés, soit par le nom du premier auteur de l'article principal. Dans ce dernier cas, seule la première lettre du nom est en majuscule, et les lettres suivantes sont minuscules, afin d'éviter toute ambiguïté.

2) La bibliographie indiquée est limitée aux articles effectivement utilisés pour le résumé, et entièrement lus en double lecture. Il ne s'agit donc en aucun cas de la totalité des publications relatives à l'étude correspondante, mais seulement de celles qui nous ont paru indispensables à l'analyse principale de l'étude selon son protocole.

Les protocoles sont moins souvent publiés avant les résultats qu'on le souhaiterait. Nous avons toujours recouru aux publications correspondantes qu'indiquaient les auteurs.

3) L'objectif reprend dans la mesure du possible les phrases utilisées par les auteurs eux-mêmes (en retenant le cas échéant la définition donnée dans la publication préliminaire). Il est généralement clairement exprimé dans les publications, et donne même parfois la seule information disponible sur les critères de jugement de l'étude. On trouve cependant parfois des formulations différentes de l'objectif pour une même étude, et il arrive que sa formulation ne corresponde pas aux critères indiqués par ailleurs.

4) La population étudiée est définie conformément aux indications des auteurs, avec les éventuelles modifications en cours d'étude. Nous avons reproduit aussi complètement que possible les critères d'inclusion et d'exclusion, bien qu'on ne puisse pas en déduire facilement des éléments précis permettant d'extrapoler ultérieurement les résultats aux sujets correspondant à ces critères. Dans le même but, nous avons décrit succinctement les caractéristiques principales de l'ensemble de la population étudiée. Nous n'avons pas systématiquement précisé pour chaque étude que les groupes constitués par répartition aléatoire étaient comparables (ce qui est pratiquement toujours le cas pour des études dont les effectifs sont importants), mais nous avons toujours signalé s'il existait des différences assez importantes entre les groupes constitués pour affecter l'interprétation des résultats.

 5) Les modalités de traitement incluent : les modalités de répartition au hasard (nombre de groupes, stratification éventuelle) ; le caractère ouvert ou aveugle (simple ou double) de l'étude ; la durée du traitement prévu (qui n'équivaut pas toujours à la durée d'observation), ou à défaut, la date à laquelle l'étude devait se terminer ; la description détaillée des traitements dans les différents groupes. Les modalités de surveillance sont brièvement indiquées.

 6) Le paragraphe sur les critères de jugement et les modalités de jugement a fait l'objet d'une attention particulière. Nous n'avons fait figurer que les critères (majeurs et secondaires) indiqués comme tels par les auteurs. Par définition, ces critères représentent les éléments sur lesquels porte l'analyse principale, et c'est sur eux, et eux seuls, que nous avons fait porter les tests statistiques. Lorsque des analyses de sous-groupes étaient précisées a priori, nous les avons indiquées dans ce paragraphe.

La réalisation de l'analyse selon l'intention de traitement faisant partie des critères de sélection, on ne s'étonnera pas qu'elle ne fasse pratiquement jamais défaut. "oui" indique qu'elle est affirmée par les auteurs, "?" indique qu'elle n'est pas mentionnée, mais que nous n'avons aucune raison positive de la mettre en doute. Il subsiste quelques cas pour lesquels l'analyse principale des auteurs n'était pas faite selon l'intention de traitement, mais où nous avons pu, soit par des données annexées aux résultats principaux, soit par d'autres publications (méta-analyses, par exemple) reconstituer l'intention de traitement. Cette éventualité est alors indiquée.

Sous le terme "statistique", nous avons donné les éléments, aussi détaillés que possible, nécessaires à l'évaluation de l'effectif nécessaire, en fonction des risques a et b . Sauf mention du contraire, nous avons reporté les éléments publiés par les auteurs.

Nous avons également indiqué les tests par lesquels les auteurs avaient prévu d'apprécier les résultats. Le choix a posteriori d'un test statistique peut en effet être utilisé pour "améliorer" de façon non négligeable la signification statistique de certains résultats (cf. l'étude DAVIT II). C'est donc uniquement par les tests prévus a priori que l'on doit véritablement apprécier la signification statistique des résultats.

Les analyses intermédiaires et les critères d'arrêt d'étude ont été indiqués chaque fois que les données étaient disponibles.

 7) Les résultats sont toujours présentés selon le même plan :

a) Nombre total de sujets répartis au hasard, avec les éventuelles données sur le nombre de sujets considérés pour l'inclusion dans l'étude (screening), le nombre d'éligibles, d'inclus et d'exclus. Ces indications sont utiles pour apprécier le degré de représentativité de la population étudiée.

b) Information sur une éventuelle interruption prématurée de l'étude

c) Effectif et durée effective de l'étude dans chaque groupe. Lorsqu'on ne dispose que de la durée de l'étude pour l'ensemble des deux groupes, elle figure entre les deux colonnes. Les nombres de perdus de vue sont indiqués lorsqu'ils sont les mêmes pour tous les critères de jugement.

d) Pour chaque critère majeur, ainsi que pour la mortalité totale, même si elle n'a pas été prévue comme critère de jugement, sont indiqués successivement :

- le nombre ou le pourcentage de perdus de vue (sauf s'ils sont identiques à ceux indiqués plus haut)

- le nombre de sujets ayant présenté l'accident objet du critère

- l'incidence pour 1000 sujets (soit par an, si la durée de l'étude atteint au moins un an, soit par mois, soit pour la durée de l'étude, mais en aucun cas pour une durée supérieure à la durée d'observation)

- la probabilité p que la différence observée soit due au hasard, toujours déduite d'un test c _, (qui doit être inférieure à a pour que la différence observée soit statistiquement significative). Théoriquement, et sauf précaution particulière, le test de signification n'a sa pleine valeur que pour un unique critère majeur prévu a priori. Lorsque le protocole fait état de plusieurs critères, on peut, pour conserver au seuil de signification statistique la valeur a , y substituer la valeur a / Ö n, où n représente le nombre de critères (le calcul peut être fait aisément par le lecteur), en sachant que d'autres corrections ont été proposées. Nous n'avons pas indiqué p lorsque le nombre d'événements attendus était inférieur à 5 par groupe, conformément aux exigences de ce test.

- nous avons utilisé jusqu'en 1995 l'odds ratio (OR) et son intervalle de confiance au risque 0,95 (IC 95 %) :

Calcul de l'OR : E : nombre d'événements attendu dans le groupe intervention a

O : nombre d'événements observé dans le groupe intervention

xt : total des événements observés dans les deux groupes

na : effectif du groupe a ; nt : effectif total des deux groupes a et b 

 

 

Depuis, nous avons remplacé l'odds ratio par le calcul du risque relatif (RR) et de son intervalle de confiance au risque 95 % par la méthode du logarithme du RR :

Calcul du RR et de son intervalle de confiance :

na et nb les effectifs respectifs des groupes intervention A et contrôle B

xa et xb les nombres des événements observés pendant l'étude

 

 

 

 

- la réduction absolue du risque (RAR) dans le groupe intervention par rapport au groupe contrôle (un chiffre négatif indiquant une incidence moindre dans le groupe intervention) et son intervalle de confiance au risque 0,95. Elle a, par définition, la même unité que l'incidence.

 calcul du RAR : RAR = ra - rb

xt : total des accidents ; nt : effectif total

 

 

Dans tous les cas où l'hypothèse d'un risque linéaire pendant la durée de l'étude est acceptable, on a ramené les incidences, RAR et IC 95 % à l'unité de temps choisie, en divisant leur valeur par la durée moyenne d'exposition au risque.

- Si un test statistique différent du c _ était prévu a priori, le résultat donné par les auteurs est indiqué au dessous.

e) Pour chaque critère secondaire, nous avons indiqué seulement le nombre de sujets ayant présenté l'accident objet du critère, et la probabilité p que la différence observée soit due au hasard.

8) Le paragraphe remarques et conclusion regroupe plusieurs types de données, plus ou moins détaillées selon les informations disponibles et la place disponibles.

- Les données sur la praticabilité ont été, dans la mesure du possible, et en fonction des données disponibles, relativement détaillées, puisqu'elles décrivent à certains égards mieux la réalité de l'intervention que le protocole lui-même. Ces données portent le plus souvent sur la fréquence des sorties d'étude, sur les doses consommées, sur l'observance et sur des critères objectifs de consommation (dosage urinaire, par exemple) ou d'efficacité paraclinique du traitement (effet sur un critère intermédiaire, comme la cholestérolémie ou la pression artérielle).

- Les autres résultats, donnés pour information, concernent le plus souvent des événements, mortels ou non, qui ne font pas partie des critères prévus a priori. C'est pourquoi, nous avons évité systématiquement tout test statistique, dont la réalisation et l'interprétation qui en découlerait seraient incompatibles avec la rigueur que nous souhaitons. Nous mettons simplement en garde le lecteur contre la tentation de les considérer comme des résultats "prouvés".

- Les effets latéraux sont souvent rapportés de manière si détaillée dans les publications que nous avons parfois dû limiter notre choix aux plus importants d'entre eux. Aucun test statistique n'a été effectué pour comparer l'importance des effets latéraux entre les différents groupes.

- Les analyses de sous-groupes n'ont été effectuées que dans deux situations bien précises : 1) s'il s'agissait de sous-groupes prévus a priori, à condition que leurs résultats soient disponibles (ce qui n'est pas toujours le cas), avec éventuellement un test statistique. 2) s'il s'agissait de sous-groupes provenant d'une stratification de la randomisation. Dans ce cas, nous avons rapporté leurs résultats (quand ils étaient disponibles), sans test statistique. Lorsque nous disposions de données sur d'autres sous-groupes que ceux définis ci-dessus, nous nous sommes contentés d'indiquer l'existence de ces données, sans les rapporter de manière détaillée.

Viennent ensuite des remarques et conclusions personnelles, qui portent sur trois points :

- La critique méthodologique notre opinion sur la qualité méthodologique générale de l'étude, en relevant des points particulièrement contestables, aussi bien dans le protocole que dans la réalisation de l'étude ou dans la façon dont les résultats sont rapportés. Nous avons parfaitement conscience que nous ne disposons pas de tous les éléments pour critiquer, et qu'une personne particulièrement compétente dans un domaine particulier peut déceler des points critiquables qui nous ont échappés.

- Une critique éthique nous a paru parfois nécessaire. Elle prend souvent une forme interrogative, car il est rare qu'on dispose de tous les éléments…En particulier, le fait de disposer d'un "written informed consent" ne prouve en aucun cas que ce dernier réponde à ce qu'on est en droit d'exiger pour faire participer un être humain à une étude thérapeutique.

- Dans l'encadré final ("qu'en tirer ?"), nous tentons, pour chaque étude, d'en tirer les principales conclusions, en nous limitant la plupart du temps au(x) critère(s) majeur(s), et en donnant les résultats non comme un chiffre précis définitif, mais plutôt comme un ordre de grandeur. Nous n'avons pas répété dans ce cadre les intervalles de confiance, mais il est toujours important de les prendre en considération.

Les initiales des lecteurs "responsables" du résumé sont inscrites dans l'encadré "qu'en tirer", dans l'ordre alphabétique depuis 1996.

Nous avons, à chaque fois que cela était possible, fait tenir le résumé standardisé sur une double page, afin de faciliter la lecture : le but était de pouvoir disposer de l'ensemble des données (bibliographie, protocole et résultats) d'un seul coup d'oeil. Pour plusieurs études, cela n'a pas été possible du fait, soit de l'importance du protocole, soit de l'importance des résultats. Ces études sont alors rapportées en trois ou quatre pages. Cet impératif de mise en page en un espace parfois (trop) limité nous a conduits à utiliser de nombreuses abréviations, qui sont explicitées dans le glossaire, ainsi que certains mots anglais (parfois francisés) plus concis que leur traduction française : nous prions le lecteur de bien vouloir nous en excuser.