La intel·ligència artificial (IA) està entrant amb força als cossos policials dels Estats Units. Empreses com Axon prometen que les seves eines d’escriptura automàtica poden generar informes policials més ràpids i de millor qualitat. Però un nou estudi posa en dubte aquesta narrativa i obre un debat important sobre supervisió, qualitat documental i riscos institucionals.

La recerca analitza informes policials redactats amb l’assistència de la IA i els compara amb informes escrits de manera convencional. L’experiment es va dissenyar de manera que ni els supervisors que revisaven els documents, ni els investigadors que gestionaven les avaluacions, ni els participants coneixien quins textos havien estat generats amb el suport de la IA. En total, 92 supervisors policials experimentats —sergents, tinents i comandaments amb una mitjana de gairebé 22 anys d’experiència— van revisar 80 informes policials utilitzant els criteris habituals.
Els resultats són especialment rellevants perquè desmunten una idea molt estesa: que els textos produïts amb IA semblen millors perquè sonen més professionals. L’anàlisi computacional confirma que els informes assistits per la IA utilitzen un llenguatge més complex, que requereix un nivell de lectura més elevat; és a dir, contenen frases més elaborades, un vocabulari més sofisticat i una estructura més formal. Però aquesta sofisticació no es tradueix en una millor valoració operativa.
De fet, els supervisors van puntuar pitjor els informes generats amb IA quant a precisió i exactitud. Encara que les diferències globals de qualitat no siguin enormes, totes les dimensions analitzades mostraven tendències negatives per als informes assistits per la IA. I hi ha un detall especialment preocupant: els supervisors aprovaven pràcticament el mateix percentatge d’informes, tant si eren redactats amb IA com si no. Aproximadament un 22 % dels documents van ser aprovats tal com estaven, independentment de l’origen.
Això revela un problema central: els supervisors no detecten les conseqüències qualitatives que introdueix la IA. I encara més important: tampoc no poden identificar quins informes han estat escrits amb suport de la IA. Quan se’ls demanava distingir-los, els resultats eren equivalents a llançar una moneda. La seva capacitat d’identificació era pràcticament nul·la.
Aquest punt és clau des del punt de vista de la seguretat i la governança tecnològica. Moltes polítiques públiques assumeixen que la supervisió humana actuarà com a mecanisme de control davant dels errors o biaixos de la IA. Però l’estudi suggereix que aquesta confiança és exagerada. Si els supervisors no poden detectar l’ús de la IA ni els problemes que hi introdueix, la supervisió humana pot convertir-se en una falsa sensació de seguretat.
Els investigadors identifiquen dos problemes estructurals. El primer fa referència a la comunicació clara. Els sistemes d’IA tendeixen a generar textos més complexos i artificials, però els supervisors no valoren negativament aquesta complexitat perquè els criteris interns de qualitat no donen prou importància a la claredat i la comprensió del text. Això és especialment problemàtic perquè els informes policials no només els llegeixen policies: també els revisen fiscals, advocats, jutges, periodistes i, en alguns casos, jurats populars. Un informe més difícil de llegir no és necessàriament un informe millor.
El segon problema és arquitectònic. Eines com Draft One, desenvolupada per Axon, funcionen principalment a partir de transcripcions d’àudio. Això significa que la IA només pot redactar allò que “sent”. Però molts elements importants d’una intervenció policial no apareixen en l’àudio: gestos, expressions, context ambiental, objectes visibles o percepcions directes de l’agent. Els supervisors aprovaven els informes tot i detectar aquesta manca de complexitat.
La recerca també qüestiona una idea habitual en el debat sobre la IA: que els problemes es poden resoldre simplement entrenant millor els supervisors perquè detectin el contingut generat artificialment. Els autors de l’estudi argumenten que aquest enfocament és equivocat. La detecció humana no és fiable i probablement mai no ho serà de manera consistent. Per això, proposen alternatives més estructurals: conservar els esborranys originals, registrar quines dades ha utilitzat la IA, mantenir històrics de modificacions i implementar sistemes d’auditoria automàtica.
En el fons, l’estudi apunta a una qüestió més profunda. Els informes policials no són simples documents administratius; són peces narratives amb conseqüències legals i operatives importants. Un bon informe no és el que sona més sofisticat, sinó el que selecciona correctament la informació rellevant, és comprensible i resisteix l’escrutini judicial. La IA pot millorar l’aparença formal del text, però això no en garanteix la qualitat.
Per als professionals de la seguretat, aquesta investigació és una advertència clara: incorporar IA als fluxos policials pot reduir la càrrega administrativa i accelerar els processos, però també pot introduir nous riscos que són invisibles per als mateixos supervisors encarregats de controlar-los. La governança d’aquestes eines no es pot basar únicament en la confiança en la supervisió humana. Calen mecanismes tècnics, auditories i nous criteris de qualitat adaptats a una era en què els textos poden semblar impecables mentre amaguen mancances importants.
_____
Esta entrada en español / This post in English / Post en français








