Os professores britânicos alertam para o risco de utilizar essa técnica de interceptação do teclado para roubar senhas e obter informações sensíveis de forma ilegal. Essas técnicas de espionagem que envolvem a interpretação de sinais emitidos por dispositivos são conhecidas como ataques de canal lateral. O interceptador é capaz de captar ondas eletromagnéticas, consumo de bateria, sensores móveis e até mesmo sons.
O estudo britânico, que ainda não foi revisado por pares, mostra que os avanços em aprendizado de máquina estão aumentando o desempenho das técnicas de interpretação de sons. Para realizar a análise, os pesquisadores definiram o desenho da onda sonora e utilizaram uma técnica matemática para transformá-la em um sinal. A inteligência artificial é capaz de receber esses sinais e sugerir as palavras mais prováveis.
Anteriormente, já era possível detectar o que era digitado em teclados mecânicos, mesmo que barulhentos. Porém, o novo estudo testou teclados de notebook, que são mais silenciosos, mas emitem sons semelhantes aos teclados mecânicos. Isso facilita a reprodução da técnica de interceptação, segundo os autores.
No entanto, é importante destacar que é muito difícil obter o mesmo resultado em teclados diferentes, segundo o professor Marcelo Finger, da USP, que já desenvolveu inteligências artificiais capazes de detectar padrões com base em amostras de som. Além disso, senhas que apenas contenham palavras inteiras são mais vulneráveis a ataques com inteligência artificial. Isso acontece porque mesmo se o modelo entender errado o significado de uma tecla, as IAs podem corrigir os vocábulos por funcionarem com predição de palavras conhecidas.
Outro fator de risco é a proliferação de dispositivos digitais, que aumenta a quantidade de microfones nas ruas e nas casas. Isso significa que há maior chance de haver gravações com a qualidade necessária para a interpretação com maior fidelidade.
De acordo com a empresa de tecnologia Ericsson, é difícil se proteger de ataques de canal lateral, pois eles exploram características físicas dos aparelhos. Uma forma de proteção é o uso de estratégias para confundir os sinais emitidos pelos dispositivos.
No caso do aplicativo Zoom, o algoritmo do estudo britânico consegue acertar 93% do que foi digitado, o que está abaixo da precisão máxima do programa. Isso acontece porque um filtro contra ruído é utilizado no aplicativo, dificultando a diferenciação do som das teclas. Para contornar essa barreira, os cientistas britânicos utilizaram uma técnica chamada aumento de dados, que preenche os trechos cortados pelo filtro.
A pesquisa foi iniciada pelo pesquisador Joshua Harrison, da Universidade de Durham, e contou com a colaboração dos professores Ehsan Toreini, da Universidade de Surrey, e Maryan Mehrnezhad, da Royal Holloway University of London. Toreini afirma que o trabalho traz à tona uma nova forma de ataque virtual possível com o uso de machine learning. No entanto, é necessário reproduzir o estudo e testar os números por outros cientistas para validar os resultados.