Ma vediamo più nel dettaglio quali sono i punti chiave sui quali genetisti e sviluppatori potrebbero concentrarsi fin da subito:
1. INCREMENTO DELLA LUNGHEZZA DELLE READS: una delle maggiori limitazioni della tecnologia NGS oggi disponibile sta nelle reads troppo corte. La macchina che riesce a produrre le reads più lunghe è Roche 454, ma i costi di sequenziamento di questa piattaforma non sono indifferenti. Le piattaforme Illumina, che sono fra le più diffuse, producono reads piuttosto corte. Non molto migliore è la resa di altri sequenziatori (SOLiD, Ion Torrent). Purtroppo il problema è che più le reads sono corte e più difficile è fare l'alignment corretto, poiché maggiore è la probabilità che le reads siano localizzabili in punti diversi del genoma (allineamento non univoco). Reads lunghe, invece, essendo altamente specifiche in termini di sequenza, possono essere localizzate con maggiore precisione. Riuscire a ricostruire correttamente il puzzle delle sequenze geniche del paziente è fondamentale.
2. SEQUENZIAMENTO COMPLETO DI UN NUMERO SEMPRE MAGGIORE DI GENOMI UMANI: maggiore sarà la quantità di genomi per i quali sia disponibile l'intera sequenza, più precisi ed affidabili saranno i processi di variant calling e annotation. Sappiamo che moltissimi polimorifismi (cioè le varianti patologicamente neutre che sono alla base delle differenze interindividuali) sono già stati individuati. Tuttavia ne restano ancora molti da trovare e caratterizzare (cioè ad annotare nei database). Ancora oggi, in un'analisi genetica è assai facile imbattersi in varianti mai identificate prima e perciò dal significato incerto. Il sequenziamento del genoma completo di un numero maggiore di individui consentirà certamente di acquisire informazioni più precise e quindi di ridurre significativamente i problemi interpretativi delle varianti.
3. INTEGRAZIONE FRA ANALISI DEL GENOMA, DEL TRASCRITTOMA, DEL PROTEOMA e DELL'INTERATTOMA: per sapere con quale probabilità una determinata mutazione può essere biologicamente rilevante è necesessario sapere se il gene in cui questa si trova venga tradotto in proteina o trascritto in un ncRNA (non coding RNA). Non solo: idealmente dovrebbe essere possibile conoscere nel dettaglio l'interazione di quella proteina o di quel trascritto con le altre molecole della cellula. Ecco dunque che i software di analisi delle sequenze dovrebbero sapersi integrare con gli algoritmi di analisi delle proteine, dei trascritti e delle interazioni molecolari. In altre parole, analisi del genoma, del trascrittoma, del proteoma e dell'interattoma (interactome) dovrebbero operare in sinergia.
Per saperne di più: Libri e Pubblicazioni sulla Bionformatica (in italiano), Libri e Pubblicazioni sulla Bioinformatica (in inglese), Libri e Pubblicazioni sulla Next Generation Sequencing.
Argomenti correlati:
Per saperne di più: Libri e Pubblicazioni sulla Bionformatica (in italiano), Libri e Pubblicazioni sulla Bioinformatica (in inglese), Libri e Pubblicazioni sulla Next Generation Sequencing.
Argomenti correlati:
Nessun commento:
Posta un commento