El sistema de reconocimiento de voz de la NSA genera preguntas difíciles para Echo y Google Home

El sistema de reconocimiento de voz de la NSA genera preguntas difíciles para Echo y Google Home

¿Amazon y Google están haciendo lo suficiente para mantener a los espías fuera?

Supongamos que estás buscando una sola persona en algún lugar del mundo. (Lo llamaremos Waldo). Sabes quién es, casi todo sobre él, pero no sabes dónde se esconde. ¿Cómo lo encuentras?

La escala es demasiado grande para cualquier cosa que no sea un escaneo computarizado. La primera oportunidad es el reconocimiento facial, escanear su cara contra cámaras en los aeropuertos o fotos en las redes sociales, aunque contará con Waldo caminando junto a una cámara amiga y dándole una buena vista. Pero su voz podría ser aún mejor: ¿Cuánto tiempo podría irse Waldo sin hacer una llamada telefónica en las líneas públicas? E incluso si tiene cuidado con las llamadas telefónicas, el mundo está lleno de micrófonos: ¿cuánto tiempo pasará antes de que lo recojan en el fondo mientras su amigo habla con su Echo?

Resultó que la NSA tenía más o menos la misma idea. En una pieza de Intercept el viernes , el reportero Ava Kofman detalló la historia secreta de los sistemas de reconocimiento de locutores de la NSA, que datan de 2004. Uno de los programas era un sistema conocido como Voice RT, que podía hacer coincidir altavoces con una determinada voz (esencialmente resolviendo el problema de Waldo), junto con la generación de transcripciones básicas. Según documentos clasificados, el sistema fue desplegado en 2009para rastrear al jefe de personal del ejército paquistaní, aunque los funcionarios expresaron su preocupación de que había muy pocos clips de voz para construir un modelo viable. Los mismos sistemas escanearon el tráfico de voz a más de 100 teléfonos de delegados iraníes cuando el presidente Mahmoud Ahmadinejad visitó la ciudad de Nueva York en 2007..

Hemos visto sistemas de reconocimiento de voz como este antes, más recientemente con la Guardia Costera , pero nunca ha habido uno de tan largo alcance como el Voice RT, y plantea nuevas preguntas difíciles sobre las grabaciones de voz. La NSA siempre ha tenido un amplio acceso a la infraestructura telefónica de EE. UU., Algo que los primeros documentos de Snowden han llevado a casa, pero en los últimos años ha habido una explosión de asistentes de voz como Amazon Echo y Google Home, cada uno de los cuales inunda más audio de voz. nube donde podría ser vulnerable a la interceptación de la NSA. ¿Los datos del asistente doméstico son un objetivo para el programa de escaneo de voz de la NSA? Y si es así, ¿Google y Amazon están haciendo lo suficiente para proteger a los usuarios?

En casos anteriores, las autoridades se han interesado principalmente en obtener datos incriminatorios específicos recogidos por un asistente de hogar. En el caso de asesinato de Bentonville el año pasado, la policía buscó grabaciones o transcripciones de un Echo específico, con la esperanza de que el dispositivo se hubiera disparado accidentalmente durante un momento crucial. Si esa táctica funcionó consistentemente, podría ser un problema de privacidad para los propietarios de Echo y Google Home, pero casi nunca lo hace. Dispositivos como el Echo y Google Home solo retienen datos después de escuchar su palabra ("Okay Google" o "Alexa"), lo que significa que todos los policías obtendrían una lista de comandos intencionales. Los investigadores de seguridad han intentado superar esa salvaguarda de wake-word durante años, pero hasta ahora no pueden hacerlo sin un hack de firmware en persona, en ese punto también podrías instalar tu propio micrófono.

Pero la herramienta de la NSA sería después de la voz de una persona en lugar de cualquier palabra en particular, lo que haría que la palabra clave fuera mucho menos problemática. Si puede enviar todos los comandos de voz a los servidores de Google o Amazon, se le garantiza un perfil completo de la voz del propietario del dispositivo, e incluso puede obtener un visitante domiciliario en el fondo. Y debido a que los algoritmos de conversión de voz a texto todavía son relativamente nuevos, tanto Google como Amazon mantienen los archivos de audio en la nube como una forma de catalogar los errores de transcripción. Son muchos datos, y The Intercept tiene razón al pensar que sería un blanco tentador para la NSA.

Cuando la policía trata de recopilar grabaciones de un asistente de voz, tiene que cumplir con las mismas reglas de autorización que su correo electrónico o sus archivos de Dropbox, pero la NSA también puede tener una forma de evitar la orden. La recopilación de datos aún requeriría una orden judicial (en el caso de la NSA, una aprobada por el tribunal de FISA), pero no necesariamente se deberían recopilar los datos. En teoría, la NSA podría apelar a las plataformas para escanear sus propios archivos, argumentando que estarían ayudando a localizar a un peligroso terrorista. Sería similar a las exploraciones que las compañías ya realizan para abuso infantil, terrorismo o material protegido por derechos de autor en sus redes, todas las cuales son en gran medida voluntarias. Si las empresas cumplían, el problema podría mantenerse fuera de los tribunales convencionales por completo.



Albert Gidari, director de privacidad en el Stanford Center for Internet and Society, dice que ese tipo de desacuerdo es un problema inherente cuando las plataformas están almacenando datos amigables con la biometría. Después de años de litigios sellados, aún no está claro cuánta ayuda tiene el gobierno para obligar. "En la medida en que las plataformas almacenen datos biométricos, son vulnerables a las demandas gubernamentales de acceso y divulgación", dice Gidari. "Creo que el gobierno podría obtener una orden de asistencia técnica para facilitar el escaneo, y bajo [ la provisión de asistencia técnica en] FISA, quizás para construir la herramienta también".

Todavía no tenemos ninguna evidencia real de que esas órdenes estén siendo atendidas. Todo El Intercepción artículo habla de cómo es el programa trabajó dentro de la NSA, y nadie en Google o Amazon ha sugerido nunca algo como esto podría ser posible. Pero todavía hay buenas razones para sospechar: si se entregara tal orden a una compañía de tecnología, probablemente vendría con una orden de mordaza que les impediría hablar de lo que habían hecho.

Hasta el momento, ha habido poca transparencia sobre la cantidad de datos que las agencias obtienen de los asistentes de voz personales, en su caso. Amazon ha sido notablemente inseguro sobre la inclusión de solicitudes de datos Echo en su informe de transparencia. Google trata las grabaciones de voz como datos generales de usuario y no desglosa las solicitudes que son específicas de Google Home. Al llegar para su comentario, un representante de Amazon dijo que la compañía "no divulgará la información del cliente sin una demanda legal válida y vinculante que se nos haya notificado adecuadamente".

El signo más ominoso es la cantidad de datos que los asistentes personales aún conservan. No existe una razón técnica para almacenar el audio de cada solicitud de forma predeterminada, especialmente si presenta un riesgo de privacidad. Si Google y Amazon querían disminuir la amenaza, podrían dejar de registrar solicitudes bajo usuarios específicos, atándolos en su lugar a un identificador anónimo como lo hace Siri. De lo contrario, podrían retener texto en lugar de audio, o incluso procesar la conversión de voz a texto en el dispositivo.



Pero el Echo y el Hogar no se hicieron con la NSA en mente. Google y Amazon estaban tratando de crear asistentes útiles, y probablemente no consideraron que también podría ser una herramienta de vigilancia. Aún más, no consideraban que la voz de una persona pudiera ser algo que tuvieran que proteger. Al igual que la orientación publicitaria y el alojamiento en la nube, lo que comenzó como tecnología de la información se está convirtiendo en un sistema de vigilancia y control. Lo que suceda después depende de Google, Amazon y sus clientes.