Graças ao esforço de pesquisadores internacionais, mais de 1,2 milhão de sequências do genoma do coronavírus de 172 países e territórios já foram registrados em uma plataforma de dados online chamada GISAID (Iniciativa Global sobre Compartilhamento de Dados da Gripe Aviária, em português).

O número de genomas do coronavírus é alto, mas não é motivo de alarde (para comparação, o vírus do HIV tem 50 milhões de cepas diferentes pelo mundo). Apenas as mutações brasileira, sul-africana e britânica são consideradas como uma variante de preocupação (VOC) pela Organização Mundial de Saúde (OMS). As restantes ficam na categoria de "variantes sob investigação".

A plataforma GISAID tem sido crucial para cientistas de todo o mundo que estudam as origens do SARS-CoV-2, o movimento das variantes e a epidemiologia dos surtos que vêm acontecendo. Nela, os cientistas podem ver como os genomas da sua região se relacionam com outros e explorar o surgimento de novas variantes diariamente.

Bancos de dados para sequências de genoma são comuns na comunidade científica, mas o GISAID é de longe o maior para o vírus da covid-19. Originalmente, ele foi concebido em 2006 com foco no vírus da gripe.

“Como os países estão enviando dados de tantas partes do mundo, você tem um sistema onde podemos observar como o vírus se espalha pelo mundo e ver se as medidas de controle e as vacinas ainda funcionam”, diz Sebastian Maurer-Stroh, consultor científico na organização sem fins lucrativos que hospeda o GISAID.

Os dados do Brasil são atualizados pela Fundação Oswaldo Cruz (Fiocruz). 3.893 genomas já foram identificados no país, com foco nas variantes P.1 (brasileira), B.1.35 (sul-africana) e B.1.1.7 (britânica).

Para baixar sequências do GISAID, pesquisadores devem se registrar e concordar com termos que incluem a não publicação de estudos baseados nos dados sem reconhecer os cientistas que enviaram as sequências. Apesar de incomodar alguns, outros acreditam que a regra é o motivo do banco de dados estar alcançando seu marco de 1 milhão de genomas agora.

“Esta é a primeira vez que vejo pessoas compartilhando tantos dados antes da publicação”, analisa Tulio de Oliveira, diretor da Plataforma de Inovação e Sequenciamento de Pesquisa KwaZulu-Natal em Durban, na África do Sul.

Esforço (quase) internacional

Quando o coronavírus passou a se espalhar na China, a equipe do GISAID começou a procurar pesquisadores e políticos internacionais para entender quais barreiras poderiam impedir a criação do banco de dados sobre o SARS-CoV-2.

Um exemplo é o de pesquisadores na África Ocidental, que afirmaram não ter o treinamento necessário em bioinformática para contribuir. Para reverter o problema, um cientista do Senegal, afiliado ao GISAID, fez workshops sobre sequenciamento, análise e como usar as ferramentas da plataforma.

Alguns países enviaram um grande número de sequências e são responsáveis ​​pela maior parte em suas regiões. Até o dia 20 de abril, os Estados Unidos haviam compartilhado 303.359 sequências e a contagem do Reino Unido era de 379.510 sequências.

Porém, nem todos os países conseguem fazer parte. Na Tanzânia, por exemplo, nenhuma sequência foi enviada (o país era liderado por John Magufuli, que negou a existência da pandemia por meses até falecer por complicações cardíacas em março de 2021).

El Salvador enviou apenas 6 sequências para 67.851 casos no total no país. O Líbano, com meio milhão de casos, enviou 49 sequências. Os números preocupam e também mostram que provavelmente existem muitos mais genomas do coronavírus andando por aí, prestes a serem descobertos.