La inteligencia artificial (IA) está entrando con fuerza en los cuerpos policiales de los Estados Unidos. Empresas como Axon prometen que sus herramientas de escritura automática pueden generar informes policiales más rápidos y de mejor calidad. Pero un nuevo estudio pone en duda esta narrativa y abre un debate importante sobre supervisión, calidad documental y riesgos institucionales.

La investigación analiza informes policiales redactados con la asistencia de la IA y los compara con informes escritos de manera convencional. El experimento se diseñó de manera que ni los supervisores que revisaban los documentos, ni los investigadores que gestionaban las evaluaciones, ni los participantes conocían qué textos habían sido generados con el apoyo de la IA. En total, 92 supervisores policiales experimentados —sargentos, tenientes y mandos con una media de casi 22 años de experiencia— revisaron 80 informes policiales utilizando sus criterios habituales.
Los resultados son especialmente relevantes porque desmontan una idea muy extendida: que los textos producidos con IA parecen mejores porque suenan más profesionales. El análisis computacional confirma que los informes asistidos por la IA utilizan un lenguaje más complejo, que requiere un nivel de lectura más elevado; es decir, contienen frases más elaboradas, vocabulario más sofisticado y una estructura más formal. Pero esta sofisticación no se traduce en una mejor valoración operativa.
De hecho, los supervisores puntuaron peor los informes generados con IA en cuanto a precisión y exactitud. Aunque las diferencias globales de calidad no sean enormes, todas las dimensiones analizadas mostraban tendencias negativas para los informes asistidos por la IA. Y hay un detalle especialmente preocupante: los supervisores aprobaban prácticamente el mismo porcentaje de informes, tanto si eran redactados con IA como si no. Aproximadamente un 22 % de los documentos fueron aprobados tal como estaban, independientemente del origen.
Esto revela un problema central: los supervisores no detectan las consecuencias cualitativas que introduce la IA. Y todavía más importante: tampoco pueden identificar qué informes han sido escritos con apoyo de la IA. Cuando se les pedía distinguirlos, los resultados eran equivalentes a lanzar una moneda. Su capacidad de identificación era prácticamente nula.
Este punto es clave desde el punto de vista de la seguridad y la gobernanza tecnológica. Muchas políticas públicas asumen que la supervisión humana actuará como mecanismo de control ante los errores o sesgos de la IA. Pero el estudio sugiere que dicha confianza es exagerada. Si los supervisores no pueden detectar el uso de la IA ni los problemas que introduce, la supervisión humana puede convertirse en una falsa sensación de seguridad.
Los investigadores identifican dos problemas estructurales. El primero hace referencia a la comunicación clara. Los sistemas de IA tienden a generar textos más complejos y artificiales, pero los supervisores no valoran negativamente esta complejidad porque los criterios internos de calidad no dan demasiada importancia a la claridad y la comprensión del texto. Esto es especialmente problemático porque los informes policiales no solo los leen policías: también los revisan fiscales, abogados, jueces, periodistas y, en algunos casos, jurados populares. Un informe más difícil de leer no es necesariamente un informe mejor.
El segundo problema es arquitectónico. Herramientas como Draft One, desarrollada por Axon, funcionan principalmente a partir de transcripciones de audio. Esto significa que la IA solo puede redactar aquello que “oye”. Pero muchos elementos importantes de una intervención policial no aparecen en el audio: gestos, expresiones, contexto ambiental, objetos visibles o percepciones directas del agente. Los supervisores aprobaban los informes a pesar de detectar esta falta de complejidad.
La investigación también cuestiona una idea habitual en el debate sobre la IA: que los problemas se pueden resolver simplemente entrenando mejor a los supervisores para que detecten el contenido generado artificialmente. Los autores del estudio argumentan que este enfoque está equivocado. La detección humana no es fiable y probablemente nunca lo será de manera consistente. Por ello, proponen alternativas más estructurales: conservar los borradores originales, registrar qué datos ha utilizado la IA, mantener históricos de modificaciones e implementar sistemas de auditoría automática.
En el fondo, el estudio apunta a una cuestión más profunda. Los informes policiales no son simples documentos administrativos; son piezas narrativas con consecuencias legales y operativas importantes. Un buen informe no es el que suena más sofisticado, sino el que selecciona correctamente la información relevante, es comprensible y resiste el escrutinio judicial. La IA puede mejorar la apariencia formal del texto, pero esto no garantiza su calidad.
Para los profesionales de la seguridad, esta investigación es una advertencia clara: incorporar IA a los flujos policiales puede reducir la carga administrativa y acelerar los procesos, pero también puede introducir nuevos riesgos que son invisibles para los mismos supervisores encargados de controlarlos. La gobernanza de estas herramientas no se puede basar únicamente en la confianza en la supervisión humana. Se precisan mecanismos técnicos, auditorías y nuevos criterios de calidad adaptados a una era en la que los textos pueden parecer impecables mientras esconden carencias importantes.
_____
Aquest apunt en català / This post in English / Post en français








