Chatbots multiplicam a recolha de informações sensíveis dos utilizadores

Uma análise revela que as aplicações de IA conversacional recolhem cada vez mais dados sensíveis (incluindo localização, saúde e dados biométricos), aumentando os riscos de utilização para fins publicitários ou analíticos.
1 de abril, 2026

Para compreender o alcance da recolha de informações por parte das inteligências artificiais, os investigadores da Surfshark basearam a sua metodologia na análise das dez aplicações conversacionais com maior quota de mercado na loja oficial da Apple. O estudo avaliou os tipos de dados solicitados, a sua ligação com a identidade do indivíduo e a presença de anunciantes externos. Além disso, comparou esta informação com as políticas de privacidade dos programadores para determinar os períodos de retenção nos seus servidores. Os resultados indicam que todas as ferramentas estudadas registam dados dos seus utilizadores, com uma média de catorze tipos de informação recolhida sobre um máximo de 35 parâmetros possíveis. A mudança mais evidente em relação ao ano anterior observa-se no rastreamento geográfico, uma vez que atualmente 70% destes assistentes registam a localização do utilizador, contra 40% no ano anterior.

Tomas Stamulis, diretor de segurança da empresa responsável pela análise, alerta que: “Os chatbots estão a tornar-se cada vez mais agressivos com os dados dos utilizadores. A nossa investigação mostra que 70% das aplicações populares de IA recolhem agora dados de localização, um forte aumento em comparação com apenas 40% no ano passado. Este aumento na necessidade de dados também é evidente em plataformas como o ChatGPT, que recentemente aumentou a sua recolha em 70% para incluir tudo, desde métricas de saúde e condição física até ao histórico de pesquisa e dados de áudio.

Ao contrário dos motores de busca tradicionais, estes bots lidam agora com conteúdos altamente sensíveis, como documentos fiscais e registos médicos, que podem ser partilhados através de redes massivas de terceiros para anúncios direcionados. Para proteger a sua privacidade, deve tratar cada instrução como um registo público: verifique as suas configurações, desative o histórico de chat e nunca partilhe o que não gostaria que se tornasse público”. Perante este cenário, os especialistas recomendam tratar cada interação como um registo público, revendo as configurações de privacidade e desativando o histórico para evitar partilhar informações que não devem ser divulgadas.

Ao analisar o comportamento de cada ferramenta, a Meta AI lidera a captura de informações, registando 33 dos 35 parâmetros possíveis. O que representa praticamente 95% do total, sendo a única plataforma que arquiva dados financeiros. Tanto esta aplicação como o Google Gemini capturam informações de carácter muito íntimo, incluindo a origem racial ou étnica, a orientação sexual, detalhes sobre gravidez ou partos, deficiências, convicções religiosas ou filosóficas, filiação sindical, inclinação política e parâmetros genéticos ou biométricos. No caso específico do Google Gemini, o sistema recolhe 23 tipos de informação, somando ao acima referido históricos de navegação e pesquisa, a localização exata, o conteúdo gerado pela pessoa e a lista de contactos do seu dispositivo, um volume que os especialistas consideram altamente intrusivo.

Por sua vez, o ChatGPT passou de solicitar 10 tipos de dados para 17, incorporando informações sobre saúde, localização e gravações de áudio. Representando um aumento de 70% na sua apetência por dados em relação ao ano anterior. Embora 14 destes parâmetros se justifiquem para manter a operacionalidade do sistema, os registos de saúde, condição física ou publicidade não são necessários para o seu funcionamento. Essas informações excedentes são direcionadas para tarefas de análise, personalização de produtos, campanhas de marketing dos próprios criadores ou anúncios de terceiros.

Num patamar inferior em termos de volume encontra-se o Claude, que requer 13 tipos de dados. Essas informações são vitais para a manutenção dos seus servidores, a autenticação, a prevenção de fraudes e o suporte técnico. No entanto, a empresa também destina parâmetros como a localização aproximada ou os ficheiros multimédia a fins de marketing e análise.

Por fim, com a mesma quantidade de 13 parâmetros recolhidos, encontra-se o DeepSeek, que regista as entradas de texto e todo o histórico das conversas. Sobre esta plataforma, o responsável pela segurança do estudo sublinha que os servidores da DeepSeek estão localizados na China e a empresa retém o histórico das conversas sem estar sujeita ao Regulamento Geral sobre a Proteção de Dados europeu ou às leis federais dos EUA que supervisionam concorrentes como a OpenAI ou a Google. Esta ausência de um quadro jurídico comparável e a falta de supervisão regulatória aumentam os riscos relativos à proteção real da informação introduzida pelos utilizadores no sistema.