Três baldes AWS S3 mal configurados foram descobertos amplamente abertos na Internet pública, contendo “dezenas de terabytes” de postagens de mídia social e páginas semelhantes - todas retiradas de todo o mundo pelos militares dos EUA para identificar e criar perfis de pessoas de interesse.
Os arquivos foram achados by caçador de violação de segurança veterano Chris Vickery do UpGuard durante uma varredura de rotina de silos de dados abertos hospedados pela Amazon, e esses não estavam exatamente ocultos. Os baldes foram nomeados centcom-backup, centcom-archive e pacom-archive.
CENTCOM é a abreviação comum do Comando Central dos EUA, que controla as operações do exército no Oriente Médio, Norte da África e Ásia Central. PACOM é o nome do Comando do Pacífico dos EUA, cobrindo o resto do sul da Ásia, China e Australásia.
Vickery disse O registro hoje ele tropeçou neles por acidente enquanto fazia uma busca pela palavra “COM” em baldes S3 acessíveis publicamente. Depois de refinar sua pesquisa, o arquivo CENTCOM apareceu, e a princípio ele pensou que fosse relacionado à multinacional chinesa Tencent, mas rapidamente percebeu que era um arquivo militar dos Estados Unidos de tamanho impressionante.
“Para a pesquisa, baixei 400 GB de amostras, mas havia muitos terabytes de dados lá em cima”, disse ele. “São principalmente arquivos de texto compactados que podem se expandir por um fator de dez, então há dezenas e dezenas de terabytes por aí e essa é uma estimativa conservadora.”
Apenas um dos baldes continha bilhões de posts de mídia social 1.8 automaticamente buscados nos últimos oito anos até hoje. Ele contém principalmente postagens feitas na Ásia central, no entanto, Vickery observou que parte do material é extraída de comentários feitos por cidadãos americanos.
Os bancos de dados também revelam algumas pistas interessantes sobre para que essas informações estão sendo usadas. Documentos fazem referência ao fato de que o arquivo foi coletado como parte do programa Outpost do governo dos EUA, que é uma campanha de influência e monitoramento de mídia social projetada para atingir jovens estrangeiros e afastá-los do terrorismo.
Vickery encontrou os arquivos de configuração de desenvolvimento do Outpost no arquivo, bem como os índices do Apache Lucene de palavras-chave projetados para serem usados com o mecanismo de busca de código aberto Elasticsearch. Outro arquivo se refere ao Coral, que pode muito bem ser uma referência ao programa de mineração de dados do Coral Reef das Forças Armadas dos EUA.
“Coral Reef é uma forma de analisar uma importante fonte de dados para fornecer ao analista a capacidade de extrair quantidades significativas de dados e fornecer associações sugestivas entre indivíduos para construir essa rede social”, Mark Kitz, diretor técnico do Sistema de Terra Comum Distribuído do Exército - Exército, disse a revista Signal, da Associação de Comunicações e Eletrônica das Forças Armadas, em 2012.
“Anteriormente, nós explorávamos esses relatórios de inteligência ou quaisquer dados que estivessem disponíveis, e isso seria muito manual.”