Um pesquisador dos Estados Unidos recuperou dados de sequenciamento genético de amostras do novo coronavírus que haviam sido coletadas dos primeiros casos de Covid-19 em Wuhan, na China, e que haviam desaparecido de um banco global de dados científicos. Mais de 200 sequências do genoma do Sars-CoV-2 foram apagadas da base de dados a pedido de pesquisadores chineses há cerca de um ano; o material pode ajudar a esclarecer as origens da pandemia.
O biólogo evolucionista Jesse Bloom, especialista em vírus influenza do Fred Hutchinson Cancer Research Center, de Seattle (EUA), relata que encontrou 13 dessas sequências originais ao vasculhar arquivos que continuaram armazenados no Google Cloud. A análise desses dados, publicada na terça-feira como pré-print na plataforma BioRxiv, reforça a hipótese de que uma variedade de coronavírus pode ter circulado por Wuhan antes dos surtos relacionados ao mercado de alimentos e frutos do mar da cidade. No entanto, Bloom não alega que as descobertas apoiam uma ou outra teoria sobre a origem do vírus. O estudo ainda não passou pela revisão de especialistas independentes e não foi publicado em um periódico científico.
Bloom, que tem defendido mais pesquisas sobre a origem da pandemia de Covid-19, estava revisando dados genéticos do coronavírus publicados por diversos pesquisadores quando encontrou um artigo que mencionava 241 sequências genéticas de amostras do vírus coletadas por pesquisadores da Universidade de Wuhan em janeiro e fevereiro de 2020. A informação indicava que os dados haviam sido inseridos em uma base online chamada Sequence Read Archive (SRA), coordenada pelo National Institutes of Health (NIH), do governo dos EUA. Essa plataforma é usada por cientistas do mundo todo que depositam sequenciamentos genéticos para que outros especialistas possam analisá-los.
Porém, quando Bloom fez uma busca por essas sequências na base de dados no início deste mês, não as encontrou, pois tinham sido removidas. O pesquisador soube ainda que a remoção de arquivos do SRA só ocorre após solicitação.
O NIH disse em comunicado enviado à imprensa nesta quarta-feira que sua equipe “revisou o pedido de remoção de dados feito pelo pesquisador que os enviou” em junho de 2020, e os apagou. “O solicitante indicou que a informação sobre as sequências haviam sido atualizadas, foram submetidas a outra base, e queria que os dados fossem removidos do SRA para evitar problemas de controle de versões”, disse a instituição. “Os pesquisadores que submetem dados detêm os direitos sobre os seus dados e podem pedir que sejam removidos”.
Bloom reconhece em seu artigo que há vários motivos inofensivos pelos quais cientistas podem querer retirar dados de uma base pública. A agência americana respondeu a um pedido do Washington Post e informou que, desde o início da pandemia, houve oito ocasiões em que pesquisadores pediram a remoção de dados do arquivo; além do que foi recuperado agora, “o restante de pesquisadores era predominantemente dos EUA”.
O pesquisador americano percebeu que muitas das sequências tinham sido armazenadas em arquivos no Google Cloud. Como os nomes dos arquivos seguiam o mesmo padrão, ele conseguiu encontrar e recuperar 13 das sequências que ainda estavam na nuvem.
Bloom deixa claro que não está acusando o NIH de qualquer ilegalidade. Para ele, o pedido de remoção pelos pesquisadores chineses é suspeito.. No artigo, o autor diz que não vê “uma razão científica plausível para a remoção” e que “parece provável que as sequências foram deletadas para obscurecer a sua existência… Isso indica um esforço não muito comprometido de rastrear a disseminação inicial da pandemia”.
História de família do vírus
O sequenciamento genético de diferentes versões do vírus ajuda os cientistas a montar a sua “árvore genealógica”. Os especialistas concordam que os “ancestrais” do Sars-CoV-2 são coronavírus de morcegos, mas o caminho que ele percorreu para alcançar os humanos ainda está sendo investigado – e isso inclui as hipóteses de transmissão por animais na natureza ou de acidente de laboratório.
Assim, as sequências genéticas mais antigas devem ser mais similares às do coronavírus de morcegos, já que o vírus continua a evoluir, com mutações que o tornam mais diferente do vírus original.
Entre as amostras mais antigas que se tem do novo coronavírus estão as de casos relacionados ao mercado de frutos do mar de Wuhan, a partir de dezembro de 2019. Essas amostras contêm três mutações que não estão presentes em amostras coletadas semanas depois. Os vírus das semanas posteriores não têm essas mutações e são mais parecidos com o coronavírus de morcegos, o que indicaria que alguma linhagem anterior não passou pelo surto do mercado de Wuhan.
Bloom descobriu que as amostras que foram deletadas do arquivo também não contêm essas mutações. “Elas são três passos mais similares aos coronavírus de morcegos do que os vírus do mercado de frutos do mar de Huanan”, disse o pesquisador ao New York Times. Ou seja, essas sequências representariam uma etapa anterior da evolução do vírus. Isso indica, segundo ele, que quando o vírus chegou ao mercado já estava circulando por algum tempo em humanos de Wuhan ou outros lugares, possivelmente já no outono de 2019.
Em uma série de postagens no Twitter, Bloom falou sobre as implicações das descobertas: “Primeiro, o fato de que esse conjunto de dados foi deletado deveria nos tornar céticos de que todas as sequências iniciais relevantes de Wuhan foram compartilhadas. Nós já sabemos que muitos laboratórios da China ordenaram a destruição de amostras iniciais”.
O pesquisador disse ainda que pode ser possível obter informação adicional sobre a disseminação inicial do coronavírus em Wuhan mesmo se ações de investigadores no local forem suprimidas.
O que dizem outros especialistas
Para o virologista David Matthews, da Universidade de Bristol (Reino Unido), a análise dá peso à ideia de que, embora a pandemia tenha provavelmente se originado em Wuhan, o mercado de frutos do mar da cidade, investigado pela equipe da OMS e outros, provavelmente não tenha sido o ‘marco zero’. “O artigo também sugere que os próprios cientistas chineses estavam interessados em compartilhar abertamente os dados que estavam gerando, mas que sua abertura inicial pode ter sido restringida”, afirmou Matthews ao Science Media Centre (SMC).
Martin Hibberd, professor de Doenças Infecciosas Emergentes na London School of Hygiene & Tropical Medicine, considerou o artigo interessante, porém “especulativo”. “É preciso mais trabalho para saber o quão sólidas são essas descobertas, particularmente a exatidão e os motivos para o apagamento das sequências”, disse ao SMC.
Já Andrew Preston, da Universidade de Bath (Reino Unido), disse que, embora a análise tenha aspectos interessantes, “será difícil corroborar o trabalho”, já que a inclusão de dados deletados também traz questões sobre a sua procedência. O pesquisador disse ainda ao SMC que o artigo tem uma linguagem incomum, contém muitas suposições e conjecturas e tende a entrar em áreas não científicas, como “encobrimentos e retenção deliberada de dados”.