Dna

Il mondo in un granello… di Dna

Messa a punto una nuova strategia che permette di memorizzare enormi quantità di dati in poche molecole di Dna, con una efficienza quasi perfetta

Usando il Dna potremmo, teoricamente, immagazzinare tutti i dati del mondo in uno sgabuzzino. È più o meno questa la proporzione, se si pensa che la nuova tecnica sviluppata da scienziati della Columbia University permetterebbe di memorizzare in un solo grammo di Dna ben 215 petabyte di dati, più di 200 mila volte la capacità di un normale computer portatile da un terabyte. Nella ricerca, pubblicata su Science, un ruolo importante è svolto dalla reazione a catena della polimerasi (PCR), la tecnica di moltiplicazione dei nucleotidi – le unità del Dna – la cui scoperta valse a Kary Mullis il Nobel per la chimica nel 1993.

L’idea di usare il Dna – che a tutti gli effetti è una memoria naturale – per conservare dati a lungo termine non è nuova all’interno della comunità scientifica, soprattutto perché, come spiega Yaniv Erlich, primo autore della ricerca “il Dna non si degrada nel tempo come i nastri o i CD, e non diventerà mai obsoleto”. La fattibilità dell’impiego della doppia elica era già stata comprovata recentemente, ma nel nuovo studio ci si è spinti oltre, andando a migliorare di circa venti volte l’efficienza di memorizzazione precedentemente stabilita e arrivando quasi a raggiungere il limite teorico consentito.

Per farlo, i ricercatori hanno tratto ispirazione da algoritmi informatici detti codici a fontana, tipicamente usati nello streaming video su internet. Questi algoritmi permettono di decodificare senza errori un file generando e distribuendo in modo casuale una serie di indizi che ne guidano la ricostruzione in modo univoco: come in una sorta di Sudoku, dove i pochi numeri inizialmente dati servono a capire come riempire il resto della griglia vuota, in un algoritmo a fontana invece di inviare un file intero si inviano molti indizi su di esso. Ciò ne consente la ricostruzione, anche nel momento in cui qualcuno di questi indizi venga perso. I file scelti per l’esperimento sono stati: un sistema operativo, un cortometraggio, una gift card Amazon da cinquanta dollari, un virus informatico, una targa Pioneer e il celebre studio del 1948 di Claude Shannon che ha aperto il campo della teoria matematica dell’informazione.

Yaniv Erlich in laboratorio (Credits: New York Genome Center)

I ricercatori hanno proceduto come segue. I poco più di due megabytes risultanti dalla compressione dei suddetti file sono stati suddivisi in piccoli pacchetti binari in cui gli uno e gli zero sono stati associati alle basi nucleotidiche (A, C, T, G) del Dna; a questi pacchetti sono stati inoltre affiancati – un po’ come delle etichette – gli indizi aggiuntivi previsti dall’algoritmo a fontana per consentire di riassemblare il tutto nel corretto ordine in una fase successiva. Il codice digitale generato con questo procedimento, rappresentato da una lista di 72 mila filamenti di Dna, è stato poi inviato a un laboratorio esterno specializzato nel convertire dati digitali in dati biologici. In questo caso, la conversione ha portato alla sintesi di un minuscolo granello di Dna, che, rispedito al mittente, è stato quindi analizzato usando tecniche di sequenziamento e software per operare la traduzione inversa, da codice genetico a codice binario. Alla fine, i ricercatori sono stati in grado di recuperare i file intatti – con zero errori – non solo dal granello originale di Dna, ma anche da tutte le numerose copie e copie di copie prodotte attraverso PCR, dimostrando la totale affidabilità e robustezza della strategia impiegata.

La nuova tecnica fornisce lo schema di archiviazione dati a più alta densità mai creato, e se si considera che procediamo a un ritmo tale per cui negli ultimi due anni sono stati creati più dati che in tutta la storia precedente, averla a disposizione è sicuramente un’ottima notizia. Al momento però, la procedura ha dei costi proibitivi, che di fatto ne rendono improbabile la diffusione su larga scala: “Non è che da domani andremo al negozio di informatica a comprarci un hard drive a Dna”, spiega Erlich. Per qualche anno – almeno – dovremo continuare ad accontentarci dei buoni vecchi dispositivi elettronici.

 

Credits immagine in evidenza: Wikimedia Commons