La validité des évaluations du risque de violence envers la partenaire intime : une méta-analyse 2007-07

La validité des évaluations du risque de violence envers la partenaire intime : une méta-analyse 2007-07 Version PDF (142 Ko)

R. Karl Hanson
Leslie Helmus
Guy Bourgon

Table des matières

Remarques des auteurs

Nous tenons à remercier J. Campbell, L. Cattaneo, Z. Hilton et R. Kropp qui nous ont aidés à trouver des études pour la méta-analyse dont il est ici question.

Les opinions exprimées par les auteurs ne sont pas nécessairement celles de Sécurité publique Canada.

Toute correspondance doit être adressée à :

R. Karl Hanson,
Recherche correctionnelle,
Sécurité publique Canada,
340, avenue Laurier Ouest,
Ottawa (Ontario)  K1A 0P8.
Courriel : karl.hanson@ps-sp.gc.ca

Résumé

La présente méta-analyse examine la précision des prédictions faites au moyen de diverses méthodes et de différents outils qui servent à évaluer le risque de récidive chez les hommes violents envers leur conjointe. En tout, on a trouvé 18 études qui étudient le rapport entre une première évaluation du risque et la récidive subséquente sous forme de violence conjugale ou d'autre type de violence. En général, les diverses méthodes permettent de faire des prédictions de précision moyenne quant à la récidive en matière de violence conjugale. Les outils structurés conçus expressément pour évaluer le risque de violence conjugale offrent un niveau de précision semblable (précision moyenne pondérée d de 0,40; 10 études) à celui des outils conçus pour prédire la récidive violente ou la récidive d'ordre général (précision moyenne pondérée d de 0,54; 4 études) et à celui des évaluations globales du risque faites par les conjointes (précision moyenne pondérée d de 0,36; 5 études). Les outils les plus précis sont ceux dont les éléments ont été choisis de manière empirique (c'est-à-dire en fonction des variables explicatives relevées dans les données de groupe). Il faudrait mener des recherches plus approfondies pour déterminer la mesure dans laquelle les outils d'évaluation du risque particuliers à la conjointe offrent des données utiles qui ne figurent pas déjà dans les outils d'évaluation du risque bien établis conçus pour la récidive en général ou la récidive avec violence. Par ailleurs, on pourrait peut-être augmenter la précision de l'évaluation du risque faite par la partenaire en améliorant la structure de cet outil.

Introduction

Dans le cas d'un homme violent avec sa partenaire intime, l'évaluation du risque peut exercer une influence considérable sur la réaction des policiers, des tribunaux, des agents de probation et des intervenants. Mais, ce qui revêt peut-être encore plus d'importance, l'évaluation du risque exerce un effet sur la réaction et les décisions de la victime. Comparativement aux progrès considérables réalisés dans l'évaluation du risque de récidive criminelle d'ordre général et avec violence (Andrews et Bonta, 2006, chapitre 9; Hanson, 2005), il n'y a eu que relativement peu de travaux empiriques réalisés au sujet de l'évaluation du risque de violence envers une partenaire intime. L'examen réalisé par Dutton et Kropp (2000, p. 178) précisait que « [traduction] la science et la pratique de l'évaluation du risque de violence conjugale n'en est encore qu'à ses débuts ». Néanmoins, ces auteurs avaient formulé l'espoir que, dans un proche avenir, la recherche permettrait d'appuyer la validité de certains des différents outils et des diverses méthodes proposés. Le présent document sert à déterminer la mesure dans laquelle cet espoir s'est réalisé.

Les approches les plus courantes adoptées pour l'évaluation du risque de violence conjugale sont : a) les estimations faites par la partenaire (la victime); b) les échelles du risque de violence conjugale (tant les outils actuariels que le jugement professionnel structuré); c) les échelles de risque conçues pour prédire la récidive d'ordre général ou la récidive violente.

Dans le cas des estimations faites par la partenaire, l'approche consiste en un jugement non structuré. Ni les facteurs de risque, ni le mode de combinaison des facteurs de risque dans une évaluation globale ne sont précisés. Il faut souligner le manque d'uniformité de cette forme d'évaluation. En effet, différentes partenaires procèdent différemment.

Dans l'un des types d'échelles d'évaluation du risque de violence conjugale, les évaluateurs combinent mécaniquement les estimations dans une liste structurée de facteurs de risque, de manière à obtenir une note globale (p. ex. dans le Domestic Violence Screening Instrument, ou échelle DVSI; Williams et Houghton, 2004). Souvent, on les désigne comme des évaluations « actuarielles », d'après la distinction classique faite par Meehl (1954) entre l'évaluation actuarielle et l'évaluation clinique. Dans le cas du jugement professionnel structuré, les évaluateurs classent les facteurs de risque de manière semblable, dans une liste structurée, mais l'évaluation globale du risque est laissée au jugement du professionnel (p. ex. dans l'échelle d'évaluation du risque de violence conjugale, ou échelle SARA; Kropp, Hart, Webster et Eaves, 1995).

Parmi les échelles d'évaluation du risque de violence conjugale, la Dangerous Assessment, ou échelle DA, constitue la plus ancienne mesure encore couramment utilisée (Campbell, 2005). À l'origine, elle a été établie dans le contexte des soins prodigués en salle d'urgence, en vue d'évaluer le risque qu'une femme battue ne soit par la suite tuée par son partenaire (Campbell, 1986). Bien qu'elle ait été conçue pour prédire le meurtre (un événement rare), elle a souvent servi à prédire la récidive de violence conjugale (p. ex. Heckert et Gondolf, 2004). Pour faire une évaluation au moyen de l'échelle DA, il faut établir un processus de collaboration entre l'évaluateur et la femme victime de violence conjugale. La version la plus récente de cette échelle (2003) comprend une description chronologique de la fréquence et de la gravité des abus, 20 questions auxquelles il faut répondre par oui ou par non (par exemple : Possède-t-il une arme à feu? Est-il en chômage?) et un algorithme qui permet de traduire les réponses en catégories de risque (Johns Hopkins University School of Nursing, 2005).

Un outil remarquable est l'échelle d'évaluation du risque de violence conjugale, ou échelle SARA. Il s'agit de l'outil de jugement structuré le plus largement employé dans les évaluations du risque de violence conjugale. Il contient 20 points qui couvrent le passé criminel, le fonctionnement psychologique et le niveau actuel d'adaptation sociale. Les auteurs soulignent qu'il ne s'agit pas d'un test en soi, mais plutôt d'un guide pour structurer le jugement professionnel (Kropp et coll., 1995). Évidemment, la qualité du jugement professionnel dépend des compétences et de la formation de l'évaluateur, ainsi que de la qualité de l'information disponible. Dans les monographies, on délaisse souvent la question du jugement professionnel en fondant l'évaluation finale du niveau de risque sur une simple somme des divers éléments de risque (p. ex. Williams et Houghton, 2004). Quand on s'en sert de cette manière, on peut considérer l'échelle SARA comme une échelle d'évaluation du risque de violence conjugale, même s'il faut noter que ce n'était pas l'intention des auteurs.

Une autre mesure importante est l'Ontario Domestic Assault Risk Assessment, ou échelle ODARA (Hilton et coll., 2004; Mental Health Centre, Penetanguishene, 2005), une évaluation du risque de voies de fait contre un membre de la famille qui est employée en Ontario et qui est considérée comme une échelle du risque de violence conjugale. Contrairement à de nombreuses autres échelles dont les éléments ont été tirés de la théorie ou de recherches antérieures, l'échelle ODARA a été élaborée de manière empirique. On a examiné des aspects qui peuvent être évalués de manière fiable par la police pour en déterminer la validité ajoutée dans la prédiction de communications subséquentes avec les policiers pour des motifs de violence conjugale. Par la suite, l'échelle a fait l'objet d'essais auprès d'un nouvel échantillon de validation. L'échelle ODARA permet d'attribuer une note dichotomique à chacun des 13 éléments qu'elle contient. En additionnant ces notes, on obtient une note totale. Les éléments portent sur l'abus d'alcool ou d'autres drogues, les antécédents violents de l'agresseur, le nombre d'enfants dans la famille et les obstacles qui empêchent la victime d'avoir recours à l'aide.

La plus grande partie de la recherche sur ces échelles de risque a été menée récemment. En dépit des prétentions des promoteurs d'échelles déterminées, la méthode la plus précise d'évaluation du risque n'a toujours pas été créée. Ces échelles offrent-elles une évaluation plus précise que lorsque l'on demande aux femmes victimes si elles s'attendent à ce que leur partenaire soit de nouveau violent envers elle à l'avenir? La réponse à cette question n'est toujours pas connue. En ce qui concerne la prédiction de la violence d'ordre général, les opinions non structurées quant au risque sont moins précises que les échelles actuarielles – souvent à peine meilleures que des prédictions aléatoires (Quinsey, Harris, Rice et Cormier, 2006, chapitre 4). On relève la même tendance dans la prédiction de la récidive criminelle en général (Andrews et Bonta, 2006). Cependant, les prédictions des femmes à propos du comportement violent de leur partenaire peuvent constituer un cas particulier, compte tenu de leur connaissance personnelle du problème (p. ex. Weisz, Tolman et Saunders, 2000).

Une autre question importante est la mesure dans laquelle les échelles particulières d'évaluation du risque de violence conjugale sont même nécessaires. Les principaux facteurs de risque d'une récidive de violence conjugale ressemblent à ceux de la récidive criminelle d'ordre général (p. ex. l'abus d'alcool et d'autres drogues, le chômage; Cattaneo et Goodman, 2005; Gendreau, Little et Goggin, 1996; Hilton et Harris, 2005, sous presse). De même, plusieurs études ont permis de constater que les échelles de risque conçues pour la récidive violente et la récidive en général permettent également la prédiction de la récidive en matière de violence conjugale (Bourgon et Bonta, 2004; Grann et Wedin, 2002; Hendricks, Werner, Shipway et Turinetti, 2006; Hilton, Harris, Rice, Houghton et Eke, sous presse).

Comme cela a déjà été souligné, l'objet de la présente méta-analyse consiste à évaluer les progrès réalisés dans l'évaluation du risque de violence conjugale depuis l'examen effectué par Dutton et Kropp (2000). Plus précisément, on examine la preuve empirique en fonction de la validité prédictive des diverses approches adoptées pour l'évaluation du risque que posent les hommes coupables de voies de fait sur leur partenaire intime. Les échelles de risque ont été divisées entre, d'une part, celles qui ont été spécifiquement conçues pour prédire la récidive en matière de violence conjugale (p. ex. l'échelle ODARA et l'échelle DA) et, d'autre part, celles qui ont été conçues pour prédire la récidive en général ou la récidive violente (p. ex. le Level of Service/Case Management Inventory, ou échelle LS/CMI – Andrews, Bonta et Wormith, 2004). Bien que l'on relève plusieurs examens détaillés récents de la recherche sur les évaluations de risque en matière de violence conjugale (p. ex. Campbell, Glass, Sharps, Laughon et Bloom, 2007; Hilton et Harris, 2005, sous presse), le présent document semble constituer le premier examen quantitatif à faire appel aux techniques courantes de la méta-analyse (Cooper et Hedges, 1994; Hanson et Broom, 2005).

Méthode

Échantillon

Les recherches informatisées sur les sites PsycINFO, National Criminal Justice Reference Service (États-Unis), Proquest Digital Dissertations et Web of Science ont été menées au moyen des termes-clés anglais suivants (traduction du terme entre parenthèses) : risk assessment (évaluation du risque), risk instrument (instrument d'évaluation du risque), risk scale (échelle de risque), prediction (prédiction), spousal (conjoint), partner (partenaire), domestic (familial), wife (épouse), marital (conjugal), assault (voies de fait), abuse (abus), violence (violence), batterers (agresseurs), SARA, ODARA, K-SID, DAS, VRAG, PCL-R, DVSR, PRA, SRA-PA, LSI, PAPS, DV-MOSAIC et PAS (tous ces sigles correspondent à des outils d'évaluation; ils ne sont pas traduits). Les autres sources comprennent les listes de référence des études empiriques et des examens antérieurs ainsi que les réponses aux lettres envoyées à 18 chercheurs reconnus dans le domaine de la récidive en matière de violence conjugale.

On a inclus les études qui portent sur la capacité des évaluations du risque de prédire la violence conjugale ou toute autre forme de récidive violente (y compris la violence conjugale) chez les délinquants libérés qui avaient été trouvés coupables de violence conjugale. On a défini les évaluations du risque comme des évaluations globales du risque de récidive (p. ex. la dangerosité, la probabilité de récidive) faites avec ou sans l'aide de lignes directrices ou d'outils actuariels. Les études qui traitent seulement d'aspects particuliers relatifs au risque (p. ex. le niveau de violence, les avantages du traitement) n'ont pas été retenues. Seule l'échelle de la psychopathie révisée, ou échelle PCL-R, fait exception. Elle a été incluse dans la méta-analyse parce qu'elle sert parfois à l'évaluation globale du risque. L'étude menée sur ce sujet qui, de loin, porte sur le plus vaste échantillon (N = 14 970; Williams et Harris, 2006) a été exclue parce que l'échantillon en question contient une proportion considérable de délinquantes (29 %).

Pour être incluses dans la présente méta-analyse, les évaluations du risque devaient avoir été élaborées au moyen d'échantillons différents de ceux qui ont fait l'objet de l'étude (c'est-à-dire que tous les essais des méthodes d'évaluation du risque devaient être reproduits sur de nouveaux échantillons). Toutes les évaluations du risque ont été menées sans tenir compte du statut en matière de récidive. Les études devaient inclure suffisamment de données statistiques pour permettre le calcul de d (l'ampleur de l'effet) et du taux de récidive (violence conjugale ou violence en général). Dans le cas des variables dichotomiques, au moins cinq sujets étaient requis pour toutes les distributions marginales.

En août 2007, la recherche a permis d'obtenir 33 documents utilisables (p. ex. des articles publiés, des livres, des rapports gouvernementaux, des exposés). Quand un même ensemble de données faisait l'objet de plusieurs articles, on a considéré que tous les résultats de ces articles provenaient d'une même étude. Par conséquent, les 33 documents correspondaient à 18 études distinctes (pays d'origine : 10 des États-Unis, 6 du Canada et 2 de Suède; 14 études (78 %) ont été publiées; les études ont été produites entre 2000 et 2007, la médiane se situant en 2003 et 2004; la taille moyenne de l'échantillon s'établissait à 333, avec une médiane de 188, et un intervalle de 49 à 1 465). La plupart des délinquants provenaient du milieu communautaire (dans 10 cas, de la communauté; dans un cas, d'une institution; dans 6 cas, des deux; dans un cas, de provenance inconnue). Dans les cas où l'on fournissait des données démographiques, les délinquants étaient en prédominance de race blanche [dans 8 études sur 9].

L'ampleur de l'effet a été calculée à l'égard de deux critères de résultat : a) toute récidive en matière de violence conjugale (par rapport à aucune récidive ou à une récidive de violence autre que conjugale – 94 valeurs); b) toute récidive violente (violence conjugale ou autre; par rapport à aucune récidive ou à une récidive de violence autre que conjugale – 28 valeurs). Pour les diverses catégories de mesures, l'ampleur de l'effet est signalée uniquement s'il existe au moins trois études.

Les sources les plus fréquemment consultées pour obtenir des données sur les récidives sont les dossiers locaux (d'état ou provinciaux) de justice pénale (k = 9; 50 %), et des dossiers nationaux (k = 9; 50 %). Dans six études (33 %), on a employé le rapport fait par la partenaire. En additionnant ces pourcentages, on obtient plus de 100, car certaines études ont fait appel à des sources multiples. Dans les études où l'on a consulté une forme quelconque de dossier de justice pénale (k = 13; 72 %), on a employé comme critère de récidive l'arrestation et les accusations (k = 8), les appels aux policiers et les rapports de police (k = 3) ou la condamnation (k = 2). Sur les six études qui ont employé le rapport fait par la partenaire pour l'obtention de données sur la récidive, tous les critères de récidive ont été définis de façon suffisamment précise pour que les actes soient considérés comme une infraction au code criminel (p. ex. les menaces de suicide ou la jalousie extrême n'étaient pas considérées comme de la récidive). Sur les 15 études (83 %) qui indiquaient la durée moyenne du suivi, les périodes variaient de 2,7 mois à 82,5 mois, soit une moyenne de 28,5 mois (é.-t. = 24,9).

Codage

Chaque étude a été codée au moyen d'une liste normalisée de variables et de règles de codage explicites (disponible sur demande). Huit études ont été codées indépendamment par Karl Hanson et Leslie Helmus, pour ensuite faire l'objet de discussions en vue de l'établissement d'un consensus. Pour les quelques premières études, ce processus a souvent entraîné la révision du manuel de codage. Les 10 autres études ont été codées par Leslie Helmus, et les résultats ont été révisés par Guy Bourgon. Le coefficient d'objectivité n'a pas été officiellement calculé; cependant, la plupart des différences de codage ne sont attribuables qu'à de simples omissions ou à des erreurs d'écriture. Une seule conclusion par variable individuelle a été codée pour chaque échantillon, en fonction de la taille de l'échantillon et de l'exhaustivité des données.

Indice de la précision des prédictions

L'indicateur de l'ampleur de l'effet correspond à la différence moyenne normalisée, d, définie de la façon suivante : d = (M1 – M2)/Sw, où M1 est la moyenne du groupe déviant, M2 est la moyenne du groupe non-déviant et Sw est l'écart-type cumulé interne (Hasselblad et Hedges, 1995). En d'autres mots, permet de mesurer la différence moyenne entre les récidivistes et les non récidivistes et de comparer cette différence à la différence entre les récidivistes les uns aux autres et les non récidivistes les uns aux autres.

La donnée statistique d a été retenue parce qu'elle est moins influencée par les taux de base de récidive que les coefficients de corrélation – l'autre paramètre statistique couramment employé dans les méta-analyses. Selon Cohen (1988), quand d s'établit à 0,20, on considère qu'il s'agit d'une petite valeur, à 0,50, d'une valeur moyenne et à 0,80, d'une grande valeur. La valeur de d est approximativement deux fois plus importante que le coefficient de corrélation calculé à partir des mêmes données. Quand l'intervalle de confiance de 95 % pour d ne contient pas zéro, on peut considérer qu'il est statistiquement significatif à p < 0,05. Quand les intervalles de confiance des deux variables explicatives ne se chevauchent pas, on peut considérer qu'elles diffèrent de manière significative l'une de l'autre.

Agrégation des résultats

Deux méthodes ont été employées pour résumer les résultats : les valeurs médianes (Slavin, 1995) et les valeurs moyennes pondérées (Hedges et Olkin, 1985). La valeur moyenne pondérée de d, d., a été calculée en pondérant chaque di par l'inverse de sa variance : formula, où k est le nombre de résultats, wi = 1/vi , et vi est la variance d'un di individuel (modèle à effet fixe). La variance de la moyenne pondérée a servi à calculer les intervalles de confiance (i.c.) à 95 % : formula; i.c. à 95 % = d. ± 1,96(Var[d.])1/2. En pondérant les valeurs d par l'inverse de leur variance, on accorde moins d'importance aux résultats des petits échantillons qu'à ceux des échantillons plus vastes.

Quand on calcule di au moyen de tableaux de dimension 2 X 2, la variance de di est estimée au moyen de la formule 19 de Sánchez-Meca, Marín-Martínez et Chacón-Moscoso (2003), et on ajoute ½ à chaque cellule afin de permettre l'analyse des tableaux qui comportent des cellules vides (Fleiss, 1994) :
formula.
Quand on calcule di à partir d'autres variables statistiques (t, superficie sous la courbe ROC, moyennes, etc.), la variance de di est estimée au moyen de la formule 3 de Hasselblad et Hedges (1995) :
formula.
En vue de vérifier si les effets sont généralisables à toutes les études, on a employé la variable statistique Q de Hedges et Olkin (1985) : formula. Cette variable statistique est distribuée selon la loi de c2 avec k-1 degrés de liberté (k correspondant au nombre d'études). Quand on obtient un Q significatif, cela indique une plus grande variation entre les études que ce que l'on obtiendrait de façon aléatoire. Les observations aberrantes ont été exclues de chaque catégorie dans les cas où la valeur extrême d'une variable simple représentait plus de 50 % de la variance totale (Q).

Résultats

Le taux observé de récidive en violence conjugale s'élève à 28 % (1 506/5 338; 14 études), et le taux de récidive violente (y compris la violence conjugale) s'établit à 16,4 % (280/1 705; 5 études). Ce dernier est plus faible que le premier car la récidive violente repose toujours sur les accusations et les condamnations officiellement consignées, alors que la récidive en matière de violence conjugale dépend souvent de critères plus larges, comme les rapports des partenaires et les communications avec la police. Une étude qui précisait à l'avance le nombre de récidivistes et de non récidivistes a été exclue des calculs de taux (Kropp et Hart, 2000). La période de suivi moyenne s'élève à 28,5 mois. Il faut considérer toutes les données comme des sous-estimations puisque toutes les infractions ne sont pas signalées ou sanctionnées.

Le tableau 1 contient un résumé de la précision moyenne pondérée des diverses méthodes de prédiction par l'évaluation du risque (voir la page 20). En ce qui concerne la récidive en matière de violence conjugale, les quatre approches (les échelles de violence conjugale, les autres échelles de risque, le jugement professionnel structuré et le jugement posé par la victime) se ressemblent. La variation au sein de chaque catégorie reste assez faible, sauf dans le cas du jugement posé par la victime, pour lequel la variation était plus grande à cause d'une étude isolée. Même si les différences entre les catégories ne sont pas significatives (les intervalles de confiance se chevauchent), les échelles de risque conçues pour prédire d'autres types de récidives (p. ex. la récidive criminelle, la récidive violente) s'avèrent, dans une certaine mesure, plus précises (d. = 0,54; i.c. à 95 % de 0,42 à 0,66) que les échelles de risque conçues pour prédire la récidive en matière de violence conjugale (d. = 0,40; i.c. à 95 % de 0,32 à 0,48). En outre, le jugement professionnel structuré (d. = 0,36; i.c. à 95 % de 0,19 à 0,54) et le jugement posé par la victime (d. = 0,36; i.c. à 95 % de 0,26 à 0,45) présentent le même degré de précision, lequel n'est que légèrement plus faible que celui obtenu au moyen des échelles de risque conçues pour prédire la récidive en matière de violence conjugale ou d'autres types de récidives.

En ce qui concerne la prédiction de la récidive violente (y compris la violence conjugale), on fait état uniquement de la précision des échelles de risque conçues pour prédire les autres types de récidive (p. ex. la récidive criminelle, la récidive violente) parce qu'il s'agit de la seule catégorie pour laquelle il existe trois études ou plus. La précision des échelles conçues pour prédire les autres types de récidive reste moyenne (d. = 0,63; i.c. à 95 % de 0,48 à 0,79).

Le tableau 2 présente la précision pondérée de la prédiction de la récidive en matière de violence conjugale pour chacune des mesures du risque (voir la page 22). Les mesures sont classées en deux catégories générales (échelles conçues pour la prédiction de la récidive en violence conjugale et échelles pour les autres types de récidive). La liste est d'abord établie selon le nombre d'études de validation, puis selon la taille de l'échantillon, dans les cas où des mesures multiples ont fait l'objet du même nombre d'études. Au sein de chaque catégorie, les outils d'évaluation du risque présentent une ampleur de l'effet faible à moyenne, et à quelques exceptions près, leurs intervalles de confiance se chevauchent. Dans le cas d'une seule mesure, l'ampleur de l'effet est négative (d = -0,09; DV-MOSAIC; c'est-à-dire que la probabilité de commettre une nouvelle infraction est plus élevée chez les délinquants qui semblent présenter le plus faible risque que chez les délinquants qui semblent présenter un risque élevé). Chose intéressante, les deux mesures les plus liées à la récidive en matière de violence conjugale sont le Guide d'évaluation du risque de violence conjugale (ou le DVRAG) et le Guide d'évaluation du risque de violence (ou le VRAG), les deux qui ont été élaborées par le secteur de la recherche du Mental Health Centre, Penetanguishene, en Ontario.

En vue de mieux étudier la contribution potentielle du jugement professionnel, l'une des échelles de risque les plus couramment utilisées, l'échelle SARA, a été divisée en études qui forment une évaluation globale du risque fondée soit a) sur le jugement professionnel (k = 2), soit b) sur la somme des éléments (k = 5). L'addition des éléments de l'échelle SARA (d. = 0,43; i.c. à 95 % de 0,32 à 0,53) semble donner un résultat légèrement plus précis que le recours au jugement professionnel (d. = 0,35; i.c. à 95 % de 0,15 à 0,55), bien que la différence ne soit pas importante, que les intervalles de confiance se chevauchent et que le nombre d'études soit peu élevé. Il vaut aussi la peine de souligner la variation considérable entre les deux études sur l'emploi de l'échelle SARA pour structurer le jugement professionnel (Q = 5,35; dl = 1; < 0,05). Les prédictions sont très précises (d = 0,76) quand les jugements émis au moyen de l'échelle SARA sont notés par les chercheurs à partir des dossiers (Kropp et Hart, 2000), alors que les prédictions sont peu précises (d = 0,21) quand ces jugements sont notés par les agents de police suédois dans le cadre de leurs fonctions (Kropp, 2003).

Analyse

Selon l'analyse dont il est fait état ici, la plupart des méthodes employées pour prédire la récidive en matière de violence conjugale n'offrent qu'une précision moyenne. Les échelles de risque spécialisées (les échelles actuarielles ou le jugement professionnel structuré) conçues pour les personnes trouvées coupables de violence conjugale offrent des niveaux de précision semblables à ceux des échelles de risque conçues pour la récidive violente ou la récidive d'ordre général, ou à ceux des évaluations du risque de récidive faites par les victimes. L'absence de données scientifiques quant à la supériorité de l'une ou l'autre des méthodes est sans doute attribuable au fait que la recherche demeure limitée. La présente méta-analyse n'a permis de trouver que 18 études, toutes produites depuis 2000. Donc, de nombreuses questions de recherche importantes restent en suspens. Comparativement, il existe au moins 79 études d'évaluation du risque que posent les délinquants sexuels (Hanson et Morton-Bourgon, 2007) et 88 études publiées après 1980 sur les mesures du risque et leur rapport avec la récidive violente (Campbell, French et Gendreau, 2007).

L'équivalence dans la précision moyenne des prédictions ne signifie pas que les méthodes sont interchangeables. Des mesures différentes pourraient permettre de contrôler des concepts différents fondés sur des données distinctes. Il est fort possible qu'il existe certains facteurs de risque propres à la violence envers la partenaire (p. ex. les obstacles qui empêchent la victime d'avoir recours à l'aide) ainsi que des facteurs pertinents aussi bien pour les hommes coupables de violence conjugale que pour les délinquants en général (p. ex. l'abus d'alcool et d'autres drogues, le chômage). Par conséquent, on pourrait peut-être améliorer la précision des prédictions en combinant des facteurs de risque spécifiques et généraux, ainsi qu'en rassemblant les données de diverses sources. Ainsi, l'échelle ODARA inclut l'évaluation par la victime du risque de récidive comme l'un des facteurs dans la grille actuarielle remplie par les policiers.

Compte tenu du nombre limité d'études, il est trop tôt pour indiquer si une échelle déterminée permet de prédire avec plus de précision que les autres la violence d'un partenaire intime. En comparaison avec les douzaines de répétitions des études sur les diverses échelles du risque de récidive générale ou sexuelle (Andrews, Bonta et Wormith, 2006; Hanson et Morton-Bourgon, 2007), la mesure du risque de violence conjugale qui a fait l'objet de la recherche la plus approfondie (k = 5) est une forme de l'échelle SARA fondée sur l'addition d'éléments, une méthode contraire à celle préconisée par les personnes qui ont élaboré le test en question. Dans seulement deux études, on applique l'échelle SARA de la manière voulue au départ. La deuxième mesure qui fait l'objet du plus grand nombre de recherches (k = 4) est l'échelle DA de Campbell (2005) qui a été conçue pour prédire la létalité, et non pas la récidive en matière de violence conjugale. Cependant, il est intéressant de noter que les échelles qui établissent le mieux le rapport avec la récidive en matière de violence conjugale sont des mesures actuarielles qui ont été élaborées de manière empirique (DVRAG, d = 0,74; VRAG, d. = 0,65). La mesure qui donne les prédictions les moins précises (DV-MOSAIC, d = -0,09) n'a pas été conçue pour faire des prédictions, mais plutôt pour « [traduction] aider à faire des évaluations et à prendre des décisions sur la gestion de cas » (Robert Martin, cité dans Berk, He et Sorenson, 2005).

Les antécédents en évaluation du risque démontrent clairement les avantages de structurer les décisions liées aux risques en fonction des données empiriques (Quinsey et coll., 2006). Cependant, les facteurs de risque fondés sur des données empiriques ne sont pas tous d'une égale utilité dans la gestion de cas. Les échelles de risque les plus utiles sont celles qui identifient les motifs du risque et qui proposent des moyens de réduire ce risque (Andrews et coll., 2006). En ce qui concerne le risque de violence conjugale, il reste de nombreuses possibilités de faire avancer la recherche et la pratique. Il faudrait mener plus de travaux pour définir avec précision les caractéristiques des délinquants et de leurs partenaires, en vue de mieux prédire la récidive et de cibler les personnes qui seraient prêtes à accepter une intervention délibérée (c'est-à-dire « les besoins criminogènes »).

Une autre approche prometteuse en matière d'évaluation du risque de violence conjugale consisterait à améliorer la structure des évaluations du risque réalisées par les partenaires. Pour le moment, les évaluations du risque faites par les partenaires se limitent pour celles-ci à répondre à de simples questions (par exemple : Croyez-vous qu'il le referait?). On ne sait donc pas par quel moyen ou à partir de quelles données les partenaires déterminent le risque. Puisqu'une meilleure structure a permis d'améliorer la prédiction du risque dans d'autres secteurs (Andrews et coll., 2006; Dawes, Faust et Meehl, 1989; Hanson et Morton-Bourgon, 2007), il est fort probable qu'une meilleure structure permettrait aussi d'améliorer la précision des évaluations du risque faites par les partenaires. Jusqu'à maintenant, l'échelle DA de Campbell (1986, 2005) est l'exemple qui se rapproche le plus de cette approche. En effet, elle permet de structurer les données fournies par la partenaire, mais l'évaluation finale du risque est faite par l'évaluateur, et non par la partenaire, laquelle peut être d'accord ou pas. Même si l'évaluation structurée du risque par la partenaire ouvre une importante avenue de recherche, elle présente des limites, comme la difficulté d'obtenir la collaboration de la partenaire (Lewin, Strand et Belfrage, 2007) et la possibilité que les actions de la victime aient des répercussions sur son évaluation (p. ex. « il n'y a pas de danger qu'il recommence puisque je le quitte… »).

Incidences sur la pratique

Avant de déterminer quelle méthode d'évaluation du risque il faut employer, les évaluateurs doivent comprendre le but de l'évaluation. Certaines évaluations sont centrées sur la nécessité de protéger et d'aider la victime; d'autres sont axées sur la probabilité que le délinquant récidive. Il est important de noter que, dans aucune des échelles qui ont fait l'objet du présent examen, on ne cherche directement à savoir si la partenaire pourrait avoir besoin d'aide ou s'il faudrait mettre un terme à la relation.

La présente méta-analyse permet de conclure que l'évaluation du risque faite par les victimes offre à peu près autant de précision que les autres méthodes d'évaluation du risque. Puisque ces évaluations sont crédibles et peu coûteuses, on devrait les effectuer quand c'est possible. Il faudrait mener des recherches plus approfondies pour déterminer si l'on peut améliorer le jugement de la victime en le structurant davantage et, si oui, pour trouver le moyen d'intégrer le jugement fait par la partenaire aux autres données pertinentes sur le risque.

En ce qui concerne la pratique et la supervision correctionnelles normalisées, les personnes coupables de violence conjugale pourraient faire l'objet d'une évaluation au moyen des outils d'évaluation du risque conçus pour la récidive d'ordre général ou violente. Les outils d'évaluation du risque en général offrent un aussi bon rendement que les outils spécialisés en violence conjugale pour ce qui est de prédire la récidive en matière de violence conjugale. Il faudrait mener des recherches plus approfondies pour savoir si les outils spécialisés contiennent des données pertinentes qui ne se retrouvent pas dans les autres échelles d'évaluation du risque (c'est-à-dire s'ils présentent une validité ajoutée). Néanmoins, les gestionnaires de cas voudront peut-être tout de même tenir compte de certains éléments des outils spécialisés et s'en servir comme guide dans leurs interventions (p. ex. les obstacles qui empêchent la victime d'avoir recours à l'aide). Pour les besoins d'une évaluation préalable à un traitement, les échelles spécialisées en violence conjugale pourraient être utiles si elles permettaient d'identifier les besoins criminogènes appropriés. Les évaluateurs devraient faire preuve de prudence dans l'interprétation de ces résultats, car la mesure dans laquelle l'une ou l'autre de ces échelles permet d'évaluer les besoins criminogènes particuliers des hommes coupables de violence conjugale n'a pas encore été déterminée.

Bibliographie

Les études précédées d'un astérisque [*] ont été incluses dans la méta-analyse.


Tableau 1. La précision moyenne pondérée des prédictions (d) des diverses formes d'évaluation du risque que posent les hommes coupables de violence conjugale

Variable Médiane Moyenne I.c. à 95 % Q k n Études
Récidive en matière de violence conjugale                
Échelles de la violence conjugale 0,45 0,40 0,32 0,48 13,86 10 3 268 Bourgon et Bonta (2004); Campbell et coll. (2005); Goodman et coll. (2000); Grann et Wedin (2002); Heckert et Gondolf (2004); Hilton et coll. (2004); Hilton et coll. (sous presse); Kropp et Hart (2000); Murphy et coll. (2003); Williams et Houghton (2004).
Autres échelles de risque 0,52 0,54 0,42 0,66 4,16 4 1 438 Bourgon et Bonta (2004); Grann et Wedin (2002); Hendriks et coll. (2006); Hilton et coll. (sous presse).
Jugement professionnel structuré 0,40 0,36 0,19 0,54 5,41 3 658 Kropp (2003); Kropp et Hart (2000); Shepard et coll. (2002).
Jugement de la victime Avec Weisz et coll. (2000) 0,47
0,49
0,36
0,40
0,26
0,31
0,45
0,49
5,65
21,19***
5
6
2 179
2 356
Campbell et coll. (2005); Cattaneo et coll. (2006); Cattaneo et Goodman (2003); Heckert et Gondolf (2004); Hilton et coll. (2004).
Toute récidive violente                
Autres échelles de risque 0,74 0,63 0,48 0,79 6,75 4 1 039 Bourgon et Bonta (2004); Girard et Wormith (2004); Hanson et Wallace-Capretta (2004); Hilton et coll. (2001).

Tableau 2. La précision moyenne pondérée (d) de la prédiction de la récidive en matière de violence conjugale pour chacune des mesures du risque

Variable Médiane Moyenne I.c. à 95 % Q  k  n Études
Échelles conçues pourla violence conjugale                
Échelle SARA – Note totale 0,47 0,43 0,32 0,53 3,60 5 1 768 Grann et Wedin (2002); Heckert et Gondolf (2004); Hilton et coll. (2004); Kropp et Hart (2000); Williams et Houghton (2004).
DA 0,58 0,41 0,31 0,52 18,47*** 4 1 585 Campbell et coll. (2005); Goodman et coll. (2000); Heckert et Gondolf (2004); Hilton et coll. (sous presse).
DVSI 0,39 0,33 0,24 0,41 12,71** 3 2 487 Campbell et coll. (2005); Hilton et coll. (sous presse); Williams et Houghton (2004).
KSID 0,14 0,15 0,00 0,30 1,95 2 881 Campbell et coll. (2005); Heckert et Gondolf (2004).
DVSR 0,47 0,58 0,41 0,75 1,49 2 689 Hilton et coll. (2004); Hilton et coll. (sous presse).
Échelle SARA – Jugement professionnel structuré 0,48 0,35 0,15 0,55 5,35* 2 531 Kropp (2003); Kropp et Hart (2000).
ODARA 0,68 0,60 0,40 0,79 1,13 2 446 Hilton et coll. (2004); Hilton et coll. (sous presse).
SRA-PA   0,39 0,13 0,65   1 502 Bourgon et Bonta (2004).
DVMOSAIC   -0,09 -0,31 0,12   1 367 Campbell et coll. (2005).
DVRAG   0,74 0,52 0,96   1 346 Hilton et coll. (sous presse).
EDAIP   0,40 0,05 0,76   1 127 Shepard et coll. (2002).
PAPS   0,62 -0,02 1,25   1 67 Murphy et coll. (2003).
Échelles conçues pour les autres formes de récidive                
VRAG 0,78 0,65 0,49 0,80 1,23 2 736 Grann et Wedin (2002); Hilton et coll. (sous presse).
PCL-R 0,68 0,60 0,45 0,75 0,46 2 736 Grann et Wedin (2002); Hilton et coll. (sous presse).
PRA   0,36 0,10 0,62   1 502 Bourgon et Bonta (2004).
LSI-R   0,43 0,06 0,79   1 200 Hendricks et coll. (2006).
Date de modification :