martedì 22 aprile 2014

THIRD GENERATION SEQUENCING: LA SOLUZIONE ALLE LIMITAZIONI DELLA NGS

sequenziamento di terza generazione (copyright 2014 - lezionidigenetica)
Dopo i primi sequenziamenti su gel di poliacrilamide la prima, vera grande rivoluzione fu quella del sequenziamento tramite elettroforesi capillare. Si trattava in entrambi i casi di sequenziamento Sanger, ossia di una metodica sequencing-by-synthesis con terminatori di catena (l'elettroforesi capillare è ancor oggi usatissima nella diagnostica di routine) . Il secondo grande balzo fu fatto con la Next Generation Sequencing (NGS, anche nota come second generation sequencing), approdata sul mercato per la prima volta nel 2005 con la piattaforma Roche/454, seguita nel 2006 dal sistema Illumina/Solexa, nel 2007 dal sistema SOLiD di Applied Biosystems, nel 2008 da Complete Genomics e nel 2010 dalle personal genome manchines (Ion Torrent e MiSeq). Con la NGS si può sequenziare un intero genoma umano con capture 30x per meno di 4000 EUR in circa 8 giorni. Una vera conquista, ma con risultati ancora lontani dal sistema perfetto come molti se lo immaginano (e come verosimilmente dovrà essere). Ed è per questo che, pur essendo la NGS una metodica ormai standardizzata e certificata, la ricerca è ora protesa allo sviluppo di sequenziatori cosiddetti di terza generazione (Third Generation Sequencing).

PERCHÉ LA NGS NON È ANCORA IL SISTEMA IDEALE?

Va subito detto che, nonostante la tecnologia avanzatissima, tutte le piattaforme NGS si basano su sistemi estremamente complessi (non di rado veramente difficili da comprendere) che pongono numerose limitazioni a causa dei costi di esercizio (che, sia pur di molto inferiori a quelli del sequenziamento Sanger, restano comunque elevati), dei tempi di analisi e del tasso di errore nei risultati. Ogni piattaforma si basa su principi e tecnologie diverse, ma tutte condividono la necessità di uno step di amplificazione del DNA. La necessità dello step di amplificazione crea problemi relati lunghezza limitata delle reads (che a sua volta si ripercuote sull'analisi bioinformatica, in particolare sulla fase di alignment), alla complessità e delicatezza della manipolazione del campione, che deve essere frammentato e ligato agli adattori prima della reazione, e al tasso di errore nella replicazione. Inoltre, come è noto, durante la reazione di amplificazione la Taq polimerasi tende a slittare in corrispondenza di regioni altamente ripetute come le isole CpG, il che rende praticamente impossibile l'analisi di alcune regioni del genoma (basti pensare a geni come FLG o a regioni come ORF15, che sono ricchi in sequenze ripetute e pertanto non interamente analizzabili). Proprio per questo motivo la copertura della NGS arriva solo 94-98% del genoma e non al 100%. Anche per quanto riguarda il sequenziamento dell'RNA (ancora molto limitato nella diagnostica di routine, ma assai utilizzato negli studi di trascrittomica), le limitazioni principali della NGS sono dovute al fatto che la molecola di RNA va retrotrascritta in cDNA.

IL SEQUENZIATORE IDEALE

È dunque chiaro che più numerose e complesse sono le fasi di manipolazione intermedie degli acidi nucleici (frammentazione, ligazione, amplificazione), più numerose sono le fonti di errore e minore è l'accuratezza dell'analisi. Nei sistemi third generation sequencing, gli ingegneri hanno cercato di eliminare o ridurre la manipolazione di DNA/RNA, puntando anzitutto su tecnologie ad elevata sensibilità che consentono di analizzare anche singole molecole originali. In effetti, come del resto abbiamo già accennato nel'articolo sul futuro della bioinformatica, la piattaforma di sequenziamento perfetta dovrebbe essere in grado di: 1) sequenziare direttamente anche una sola molecola di DNA o RNA originale di varia grandezza (da pochi nucleotidi fino a milioni di basi) senza bisogno dello step di amplificazione e della produzione di un filamento complementare a quello da sequenziare (non dovrebbe essere cioè un sequencing-by-synthesis); 2) produrre risultati senza errori, 3) utilizzare quantità veramente minime di acido nucleico (anche una sola cellula dovrebbe bastare), 4) rilevare direttamente modificazioni epigenetiche (come ad esempio la metilazione delle citosine); 5) funzionare in laboratori non specializzati ad opera anche di personale non qualificato. Il sistema ideale dovrebbe infine essere realmente accessibile, così da poter essere adottato in tutto il mondo, anche da strutture con risorse finanziarie e accademiche limitate.

PIATTAFORME THIRD GENERATION

Diciamo subito che, fra tutte le macchine NGS oggi a disposizione, ve n'è già una che per certi versi può essere considerata una macchina di terza generazione: si tratta della Ion Torrent. La Ion Torrent, che è la personal genome machine di cui ora più si parla, può essere considerata una macchina di terza generazione in virtù della sua capacità di rilevare un segnale elettronico invece che luminescente o fosforescente (la macchina rileva la liberazione di un atomo di idrogeno ogni volta che un nucleotide viene incorporato nel filamento in crescita) e, non ultimo, per i costi relativamente convenienti di esercizio (dei quali si prevede a breve un ulteriore calo fino a raggiungere l'obiettivo del genoma a 100 dollari). Accanto a Ion Torrent vi sono i sistemi a nanopori (nanopore sequencing), i sistemi di sequenziamento di singola molecola di DNA (SMDS) o sequenziamento diretto di RNA (DRS), l'eccezionale single molecule realt time sequencing (SMRT) di PacBio e altri sistemi in fasi di sperimentazione. Per conoscerli più nel dettaglio, ecco i link:

Nessun commento: