Cuidado com Modelos de IA: Malware Disfarçado em Repositórios Públicos

Um repositório malicioso no Hugging Face se disfarçou de modelo da OpenAI, infectando máquinas com malware. Entenda os riscos e como se proteger.

Cuidado com Modelos de IA: Malware Disfarçado em Repositórios Públicos

Recentemente, um repositório malicioso na plataforma Hugging Face se apresentou como uma versão da OpenAI e acabou infectando máquinas Windows com um malware do tipo infostealer. A pesquisa da empresa de segurança em IA HiddenLayer revelou que esse software malicioso foi baixado cerca de 244.000 vezes antes de ser removido. O número de downloads pode ter sido manipulado pelos atacantes para dar a impressão de que o modelo era popular, o que torna difícil avaliar a extensão real do ataque.

Como o Ataque Foi Realizado?

O repositório malicioso, nomeado Open-OSS/privacy-filter, imitou o lançamento legítimo do Privacy Filter da OpenAI. Segundo a HiddenLayer, a descrição do modelo foi copiada quase que exatamente, mas os criminosos incluíram um arquivo loader.py malicioso que buscava e executava um malware para roubo de credenciais em máquinas Windows. Esse repositório alcançou rapidamente o topo da lista de tendências no Hugging Face, acumulando 667 curtidas em menos de 18 horas, um número que também pode ter sido manipulado.

Riscos em Repositórios Públicos de Modelos de IA

A situação destaca um risco crescente em repositórios públicos de modelos de IA, onde desenvolvedores e cientistas de dados podem clonar modelos diretamente para ambientes corporativos. Esses ambientes possuem acesso a código-fonte, credenciais de nuvem e sistemas internos, tornando um repositório comprometido um problema muito mais sério do que uma simples inconveniência. O README do modelo falso, que se assemelhava ao projeto legítimo, continha instruções que desviavam do original, instruindo os usuários a executar start.bat em Windows ou python loader.py em Linux e macOS, essenciais para a cadeia de infecção.

Prevenção e Conscientização

Pesquisadores já alertaram sobre a possibilidade de códigos maliciosos estarem escondidos dentro de arquivos de modelos de IA ou scripts de instalação relacionados em plataformas como o Hugging Face. Casos anteriores envolveram arquivos de modelos serializados com Pickle, que conseguiram evitar a detecção dos scanners da plataforma. Esse tipo de cenário reforça a necessidade de uma conscientização maior entre desenvolvedores e usuários sobre os riscos associados ao uso de repositórios públicos.

O que isso significa na prática

Para profissionais e empresas que utilizam modelos de IA, é crucial adotar práticas seguras ao integrar esses modelos em seus sistemas. Isso significa:

  • Verificar a origem dos modelos e repositórios que estão sendo usados, priorizando aqueles que possuem um histórico confiável.
  • Implementar medidas de segurança em seus ambientes de desenvolvimento, como a validação de código e o uso de scanners de segurança.
  • Educar equipes sobre os riscos associados ao uso de software de terceiros e a importância de seguir procedimentos de segurança rigorosos.

Essa situação serve como um alerta para a comunidade de IA e enfatiza que a segurança deve ser uma prioridade em todas as etapas do desenvolvimento e implementação de modelos de IA.

O futuro da IA não pode ser construído sobre a insegurança. À medida que a tecnologia avança, a vigilância e a responsabilidade na utilização de modelos de IA se tornam cada vez mais essenciais, garantindo que a inovação não venha acompanhada de riscos desnecessários.


Fontes