L’intelligence artificielle s’impose progressivement au sein des forces de police aux États-Unis. Des entreprises comme Axon affirment que ses outils de rédaction automatisée permettent de générer des rapports policiers plus rapides et de meilleure qualité. Cependant, une nouvelle étude remet en question ce récit et ouvre un débat important sur la supervision, la qualité documentaire et les risques institutionnels.

La recherche analyse des rapports policiers rédigés avec l’assistance de l’IA et les compare à des rapports écrits de manière traditionnelle. L’expérience a été conçue en « triple aveugle » : ni les superviseurs chargés d’évaluer les documents, ni les chercheurs responsables des analyses, ni les participants ne savaient quels textes avaient été générés avec l’aide de l’intelligence artificielle. Au total, 92 superviseurs de police expérimentés – sergents, lieutenants et cadres ayant en moyenne près de 22 ans d’expérience – ont examiné 80 rapports policiers selon des critères habituels de qualité.
Les résultats sont particulièrement significatifs car ils déconstruisent une idée très répandue : celle selon laquelle les textes produits par l’IA paraissent « meilleurs » simplement parce qu’ils sonnent plus professionnels. L’analyse informatique confirme que les rapports assistés par IA utilisent un langage plus complexe, moins lisible et d’un niveau de lecture plus élevé. Autrement dit, ils emploient des phrases plus élaborées, un vocabulaire plus sophistiqué et une structure plus formelle. Mais cette sophistication ne se traduit pas par une meilleure évaluation opérationnelle.
En réalité, les superviseurs ont attribué des notes plus faibles aux rapports générés par IA en matière de précision et d’exactitude. Bien que les différences globales de qualité ne soient pas énormes, toutes les dimensions analysées montraient des tendances défavorables pour les rapports assistés par IA. Un détail est particulièrement préoccupant : les superviseurs valident quasiment le même pourcentage de rapports, qu’ils soient rédigés avec ou sans IA. Environ 22 % des documents ont été approuvés « tels quels », indépendamment de leur origine.
Cela met en évidence un problème central : les superviseurs ne perçoivent pas les conséquences qualitatives introduites par l’IA. Plus encore, ils ne sont pas en mesure d’identifier quels rapports ont été rédigés avec le soutien de l’intelligence artificielle. Leur demander de les distinguer équivalait à jouer à pile ou face. Leur capacité d’identification était pratiquement nulle.
Ce point est crucial du point de vue de la sécurité et de la gouvernance technologique. De nombreuses politiques publiques partent du principe que la supervision humaine constitue un mécanisme de contrôle face aux erreurs ou aux biais de l’IA. Toutefois, l’étude suggère que cette confiance est exagérée. Si les superviseurs ne peuvent ni détecter l’usage de l’IA ni identifier les problèmes qu’elle introduit, le modèle de « supervision humaine » risque de créer un faux sentiment de sécurité.
Les chercheurs identifient deux problèmes structurels. Le premier concerne la lisibilité. Les systèmes d’IA tendent à générer des textes plus complexes et artificiels, mais les superviseurs ne pénalisent pas cette complexité car les critères internes de qualité n’accordent pas suffisamment d’importance à la clarté et à la compréhension du texte. Cela est d’autant plus problématique car les rapports policiers ne sont pas seulement lus par la police : ils sont également examinés par des procureurs, des avocats, des juges, des journalistes et, dans certains cas, des jurys populaires. Un rapport plus difficile à lire n’est pas nécessairement un meilleur rapport.
Le second problème est d’ordre architectural. Des outils comme Draft One, développé par Axon, reposent principalement sur des transcriptions audio. Cela signifie que l’IA ne peut rédiger que ce qu’elle « entend ». Cependant, de nombreux éléments importants d’une intervention policière n’apparaissent pas dans l’audio : gestes, expressions, contexte environnemental, objets visibles ou perceptions directes de l’agent. Les superviseurs ont partiellement détecté ce manque de complexité, mais ils ont néanmoins continué à valider les rapports.
La recherche remet également en question une idée courante dans le débat sur l’IA : les problèmes pourraient être résolus simplement en formant mieux les superviseurs à « détecter » les contenus générés artificiellement. Les auteurs estiment que cette approche est erronée. La détection humaine n’est pas fiable et ne le sera probablement jamais de manière cohérente. Par conséquent, ils proposent des alternatives plus structurelles : conserver les brouillons originaux, enregistrer les données utilisées par l’IA, maintenir un historique des modifications et mettre en place des systèmes d’audit automatique.
En fin de compte, l’étude soulève une question plus profonde. Les rapports policiers ne sont pas de simples documents administratifs : ce sont des récits aux conséquences juridiques et opérationnelles importantes. Un bon rapport n’est pas celui qui paraît le plus sophistiqué, mais celui qui sélectionne correctement les informations pertinentes, reste compréhensible et résiste à l’examen judiciaire. L’IA peut améliorer l’apparence formelle du texte, mais cela ne garantit pas une meilleure qualité réelle.
Pour les professionnels de la sécurité, cette recherche constitue un avertissement clair : intégrer l’IA dans les flux policiers peut réduire la charge administrative et accélérer les procédures, mais cela peut également introduire de nouveaux risques invisibles pour les superviseurs chargés de les contrôler. La gouvernance de ces outils ne peut pas reposer uniquement sur la confiance dans la supervision humaine. Elle nécessite des mécanismes techniques, des audits et de nouveaux critères de qualité adaptés à une époque où les textes peuvent sembler impeccables tout en dissimulant des failles importantes.
_____
Aquest apunt en català / Esta entrada en español / This post in English








