Il sequenziamento NGS mate pair, detto anche mate pair sequencing, è un'applicazione efficace per la rilevazione di riarrangiamenti cromosomici nell'ordine delle centinaia di nucleotidi.
Il mate pair sequencing è sostanzialmente una variante del sequenziamento classico con pair-end reads. In entrambi i casi, infatti, si procede alla lettura del filamento partendo da direzioni opposte fino ad ottenere la sequenza delle sue estremità, mentre la sequenza dell'inserto centrale resta ignota, anche se ne sappiamo la grandezza (inner mate distance). La differenza principale sta nel fatto che nel mate pair sequencing il frammento di DNA viene prima circolarizzato e poi nuovamente rotto.
Ecco, in modo semplificato, i passi per la costruzione di una mate pair library: il DNA viene frammentato come al solito. Successivamente vengono selezionati, fra quelli più grandi (in genere quelli compresi fra 2 e 20 kb), solo frammenti di una determinata lunghezza, decisa a priori (ad esempio 2kb). Ecco quindi che si procede alla circolarizzazione dei frammenti di DNA, solitamente previa aggiunta di una sonda biotinalata a ciascuna delle due estremità. Il DNA così circolarizzato viene nuovamente frammentato. A questo punto si procede alla selezione dei soli frammenti contenenti le sonde biotinalate, che sono formati invero dalle estremità congiunte del frammento originario, unitesi durante la fase di circolarizzazione della molecola. L'aggiunta delle sonde biotinilate ha proprio lo scopo di permettere l'identificazione delle estremità senza dover procedere all'allineamento bioinformatico. Si aggiungono poi adattatori e primer a ciasuna estremità del frammento biotinilato e si procede al sequenziamento in direzioni opposte. Ed ecco che alla fine si ottengono le sequenze delle estremità del frammento originale, proprio come in un sequenziamento con pair-end reads. Per capire meglio gli step descritti si può dare un'occhiata alla figura qui sotto.
Il mate pair sequencing è sostanzialmente una variante del sequenziamento classico con pair-end reads. In entrambi i casi, infatti, si procede alla lettura del filamento partendo da direzioni opposte fino ad ottenere la sequenza delle sue estremità, mentre la sequenza dell'inserto centrale resta ignota, anche se ne sappiamo la grandezza (inner mate distance). La differenza principale sta nel fatto che nel mate pair sequencing il frammento di DNA viene prima circolarizzato e poi nuovamente rotto.
Ecco, in modo semplificato, i passi per la costruzione di una mate pair library: il DNA viene frammentato come al solito. Successivamente vengono selezionati, fra quelli più grandi (in genere quelli compresi fra 2 e 20 kb), solo frammenti di una determinata lunghezza, decisa a priori (ad esempio 2kb). Ecco quindi che si procede alla circolarizzazione dei frammenti di DNA, solitamente previa aggiunta di una sonda biotinalata a ciascuna delle due estremità. Il DNA così circolarizzato viene nuovamente frammentato. A questo punto si procede alla selezione dei soli frammenti contenenti le sonde biotinalate, che sono formati invero dalle estremità congiunte del frammento originario, unitesi durante la fase di circolarizzazione della molecola. L'aggiunta delle sonde biotinilate ha proprio lo scopo di permettere l'identificazione delle estremità senza dover procedere all'allineamento bioinformatico. Si aggiungono poi adattatori e primer a ciasuna estremità del frammento biotinilato e si procede al sequenziamento in direzioni opposte. Ed ecco che alla fine si ottengono le sequenze delle estremità del frammento originale, proprio come in un sequenziamento con pair-end reads. Per capire meglio gli step descritti si può dare un'occhiata alla figura qui sotto.
Come fa il mate pair sequencing ad identificare eventuali riarrangiamenti?
Molto semplice: supponiamo di aver originariamente costruito una mate pair library con frammenti di 2kb e di avere utilizzato un sistema per la produzione di reads da 200 basi ciascuna. Sappiamo dunque fin dall'inizio che la inner mate distance (cioè la grandezza dell'inserto centrale la cui sequenza resta ignota) deve essere necessariamente pari a 2000 - 200 - 200 = 1600bp. Se in fase di alignment con le sequenze di riferimento del genoma umano le reads del paziente risultano distare 1600 bp, significa che il paziente non reca né inserzioni né delezioni. Se invece le reads mappano a distanza diversa (maggiore o minore), il paziente sarà portatore di un riarrangiamento (una delezione o un'inserzione rispettivamente).
Per saperne di più: Libri e Pubblicazioni sulla Next Generation Sequencing
Molto semplice: supponiamo di aver originariamente costruito una mate pair library con frammenti di 2kb e di avere utilizzato un sistema per la produzione di reads da 200 basi ciascuna. Sappiamo dunque fin dall'inizio che la inner mate distance (cioè la grandezza dell'inserto centrale la cui sequenza resta ignota) deve essere necessariamente pari a 2000 - 200 - 200 = 1600bp. Se in fase di alignment con le sequenze di riferimento del genoma umano le reads del paziente risultano distare 1600 bp, significa che il paziente non reca né inserzioni né delezioni. Se invece le reads mappano a distanza diversa (maggiore o minore), il paziente sarà portatore di un riarrangiamento (una delezione o un'inserzione rispettivamente).
Per saperne di più: Libri e Pubblicazioni sulla Next Generation Sequencing
Nessun commento:
Posta un commento