En la primera parte de este artículo, se ha repasado la línea de tiempo de los hitos más importantes de la aparición de los asistentes de voz, así como la descripción de las tecnologías en las que se basan.
Los asistentes de voz han llegado a ser herramientas clave en muchas áreas de la vida cotidiana, desde el hogar hasta el entorno profesional. En el hogar inteligente, estos dispositivos permiten controlar luces, ajustar la temperatura y manejar la seguridad, optimizando el confort y la eficiencia energética. En cuanto a la organización diaria, ofrecen recordatorios, alarmas y calendarios, ayudando a gestionar las tareas de manera sencilla y eficaz.
También son una ventaja en el comercio electrónico, donde facilitan la realización de pedidos y ofrecen recomendaciones personalizadas, simplificando la experiencia de compra. Además, proporcionan acceso instantáneo a información y entretenimiento, como noticias, música y películas, todo adaptado a los gustos del usuario. Su papel en el ámbito educativo es cada vez más destacado, ya que apoyan el aprendizaje de idiomas, resuelven dudas de estudiantes y son una ayuda con diversas tareas. Asimismo, permiten a personas con discapacidades físicas o visuales controlar su entorno mediante comandos de voz, contribuyendo a la autonomía y la inclusión.
Por supuesto, nuevas aplicaciones también se van abriendo camino. Por ejemplo, en traducción, el "modo intérprete" de Google Assistant convierte conversaciones en tiempo real, lo cual es particularmente útil en viajes y entornos multiculturales. También, aunque aún en desarrollo, está la posibilidad de que los asistentes de voz faciliten la firma de contratos: aunque en la actualidad la mayoría de los contratos requieren métodos de firma digital o verificación biométrica, se prevé que, en un futuro, la autenticación por voz podría permitir la verificación de identidad para estos fines.
Con estos y otros usos emergentes, los asistentes de voz están constantemente adaptándose y expandiendo sus funciones para satisfacer las necesidades de los usuarios en diferentes áreas, proporcionando accesibilidad y personalización como nunca se había visto.
A medida que los asistentes de voz se integran en el día a día, los riesgos de seguridad y privacidad se vuelven más evidentes:
➡️ Recolección Masiva de Datos: Los asistentes almacenan comandos y, en ocasiones, conversaciones completas, lo que genera preocupación sobre el acceso de terceros a esta información. En 2018, se reveló que un dispositivo Amazon Echo (Alexa) grabó y envió accidentalmente una conversación privada de una pareja a un contacto de su lista [17]. Este incidente ocurrió cuando Alexa malinterpretó un comando y activó la grabación sin que los usuarios lo supieran. La pareja se enteró del hecho cuando recibieron un mensaje de texto del contacto que había recibido el audio, lo que planteó serias preocupaciones sobre la privacidad y la seguridad de los datos recogidos por los asistentes de voz.
➡️ Creación de Perfiles de Voz: Al analizar características únicas de la voz (tono, ritmo, entonación), los dispositivos pueden crear perfiles de usuario que podrían utilizarse para rastrear a las personas, convirtiendo la voz en un identificador biométrico. Los asistentes de voz pueden utilizar la biometría vocal para crear perfiles de usuario. Por ejemplo, Endesa y Mutua Madrileña permiten actualmente que los usuarios se identifiquen con su voz en los diferentes procesos de contact center de la compañía [12]. Son capaces de reducir los 90 segundos de media de identificación de un cliente a tan solo 5 segundos. Otro ejemplo es por ejemplo el sistema VALL-E de Microsoft que es capaz de clonar una voz de forma consistente con una muestra de 3 segundos [10][11][15]. Los riesgos de que este tipo de perfiles de voz puedan ser vulnerables a ataques que buscan falsificar la voz de un usuario plantean serias preocupaciones sobre la seguridad y el control de la identidad. Una de las mayores preocupaciones surge cuando los ciberdelincuentes ya tienen mecanismos para generar el patrón de voz de forma consistente con muestras de menos de 5 segundos y, además, de forma inadvertida por las víctimas.
➡️ Vulnerabilidad ante Ataques: Los asistentes conectados a la red y otros dispositivos del hogar pueden ser objetivo de ataques cibernéticos, comprometiendo datos personales y la seguridad física. Algunas de las vulnerabilidades más destacables son:
- El ataque de inyección de comandos por voz: escondidos en canciones o incluso en ruido blanco, se pueden incluir comandos que pasen desapercibidos y generen acciones no solicitadas como, por ejemplo: accesos a páginas web, realización o grabación de llamadas, activación del modo avión o incluso la modificación de los parámetros de conducción de coches inteligentes.
Estudiantes de diversas universidades han estudiado desde hace varios años este tipo de vulnerabilidades [4][13].
- Suplantación de voz (Spoofing): suplantando las voces de usuarios legítimas por voces clonadas con distintas tecnologías. Pueden conseguir que los sistemas atacados realicen acciones no solicitadas, del mismo modo que sucede con los ataques de fraude del CEO [5].
- Intercepción de datos en la nube: la intercepción de los datos que se suben a la nube para su análisis puede suponer que los ciberdelincuentes estén en disposición de perpetrar ataques como los mencionados anteriormente.
➡️ Uso Comercial No Consentido: Sin un control adecuado, los datos de voz pueden ser empleados con fines comerciales no autorizados como, por ejemplo: publicidad personalizada o venta de perfiles. Esto puede vulnerar la regulación existente, como el RGDP e impactar de forma directa con la privacidad de los usuarios. Recientemente ha habido casos en los que se ha multado a multinacionales como Amazon por importes de hasta 746 millones de euros por sus prácticas de tratamiento de datos [16].
➡️ Amenazas Futuras con respecto a la Computación Cuántica: la computación cuántica podría brindar las herramientas necesarias para romper los algoritmos de cifrado actuales como RSA o AES, exponiendo datos sensibles que hayan sido o estén siendo utilizados por los sistemas de tratamiento de voz. Se puede ampliar esta información en un artículo específico de este tema publicado anteriormente en este blog [14].
Los usuarios pueden proteger su privacidad realizando, entre otras, las siguientes acciones:
➡️ Ajustando las configuraciones de los asistentes de voz. Por ejemplo: desactivar la activación continua ("Hey Alexa" o "Ok Google") cuando no se necesite.Algunas de las normas jurídicas que afectan al uso y desarrollo de los asistentes de voz en España son:
➡️ Ley de Propiedad Intelectual (LPI) [6].No obstante, estos avances tecnológicos también han traído consigo una serie de riesgos de seguridad de la información y de las personas. La recopilación masiva de datos personales sin control, la creación de perfiles a partir de nuestra voz de forma fraudulenta y la vulnerabilidad ante ataques en el mundo digital son algunos de los mayores desafíos actuales. Además, el uso comercial no consentido de nuestros datos y el acceso no autorizado a información sensible son problemas cada vez más frecuentes y preocupantes.
Por eso, mientras aprovechamos los beneficios de estos avances, es vital que tomemos medidas para proteger nuestra privacidad. Las empresas deben garantizar una mayor transparencia y seguridad, y los usuarios deben ser conscientes de cómo proteger sus datos personales. Al mismo tiempo, es necesario un marco legal actualizado que regule estos desarrollos tecnológicos, para que podamos seguir disfrutando de la tecnología sin poner en riesgo nuestra seguridad.