Pesquisa publicada na revista Nature promete melhorar a capacidade e a eficiência dos arquivos digitais, mas ainda é demorada e cara

O DNA pode abrigar uma quantidade impressionante de informações. Um único grama de DNA pode armazenar o equivalente a 215 milhões de gigabytes de dados. Isso é suficiente para armazenar todos os livros, músicas e filmes digitais já criados. Grama por grama, o DNA pode armazenar até um bilhão de vezes mais dados do que o armazenamento baseado em silício.

O método tradicional de armazenamento de dados no DNA envolve a codificação de informações binárias (uns e zeros da computação) em sequências de bases de nucleotídeos – adenina (A), timina (T), guanina (G) e citosina (C). E depois essas sequências são sintetizadas quimicamente. Este método é promissor, mas os altos custos e as velocidades lentas de gravação de dados dificultam sua aplicação. O novo estudo aborda esses desafios introduzindo um método que codifica dados sem sintetizar novas sequências de DNA, segundo o site ZME Science.

A abordagem da equipe essencialmente “imprime” dados no DNA usando essas marcas de metilação como bits de dados binários, ou “epi-bits”. Usando uma biblioteca de modelos pré-fabricados de DNA e cadeias curtas de DNA conhecidas como tijolos, os pesquisadores poderiam orientar onde os grupos metil são colocados no DNA, permitindo-lhes codificar informações complexas sem ter que sintetizar novas moléculas de DNA do zero.

Uma das características mais notáveis desta nova abordagem é a sua capacidade de escrever dados em paralelo. A síntese tradicional de DNA é um processo em série – cada nucleotídeo deve ser adicionado um de cada vez, o que é demorado e caro. No entanto, o novo sistema permite aos pesquisadores adicionar vários epi-bits de informação simultaneamente, aumentando a velocidade e a escalabilidade do armazenamento de dados.

Digamos que você esteja escrevendo uma carta à mão. Você está escrevendo todas as letras uma por uma, o que não é muito eficiente. Mas, quando você imprime algo, você imprime uma linha inteira, o que é muito mais rápido.

Teste feito com trigre e panda — Foto: Reprodução

Teste com imagem

A equipe testou sua abordagem armazenando a imagem de um panda e uma escultura no formato de um tigre da China antiga. Eles então os recuperaram com um sequenciador de DNA.

Em seus experimentos, os pesquisadores armazenaram aproximadamente 275 mil bits de informação usando seu novo sistema (cerca de um terço de megabyte). Eles conseguiram isso empregando um conjunto de 700 “tipos móveis” de DNA (ou seja, sequências curtas de DNA pré-fabricadas) e cinco modelos universais de DNA. A tecnologia premitiu a gravação de 350 bits de dados em uma única reação, uma melhoria significativa em relação aos métodos tradicionais. A abordagem também foi confiável, apresentando alta fidelidade e taxas de erro mínimas (menos de 3%).

O estudo “Armazenamento paralelo de dados moleculares através da impressão de bits epigenéticos no DNA”, publicado na revista Nature, destaca o potencial do DNA como meio para armazenar grandes quantidades de dados de forma compacta, estável e durável.

O uso inovador de modificações epigenéticas para codificar dados oferece uma nova maneira de superar as limitações dos métodos tradicionais de síntese de DNA.

No entanto, existem enormes desafios pela frente. Para começar, apenas pequenas quantidades de informação foram armazenadas e as taxas de erro, embora relativamente baixas (abaixo de 3%), não são aceitáveis.

Outro desafio é a velocidade de recuperação de dados. Embora o sequenciamento de permita a leitura de DNA de alto rendimento, ele ainda é mais lento do que as velocidades de leitura dos dispositivos convencionais de armazenamento digital. Os avanços na tecnologia de sequenciamento serão cruciais para tornar o armazenamento de dados de DNA competitivo com os sistemas baseados em silício.

Por Patrícia Basilio