Le moderne macchine di Next Generation Sequencing (NGS)
consentono di processare un elevatissimo numero di sequenze in parallelo. Ciò
ha reso possibile analizzare in tempi rapidi e con costi accettabili il genoma
intero di un individuo (whole-genome sequencing o più comunemente genome sequencing) o parti di genoma di diversi individui in parallelo.
In altre parole, a seconda delle dimensioni delle sequenze che si desidera analizzare, è possibile eseguire l’analisi di più di un campione alla volta. Non è infrequente, ad esempio, sequenziare l’intero esoma (exome sequencing) di almeno un paio di soggetti in un’unica corsa. Similmente, in un laboratorio di microbiologia, poiché i genomi dei microorganismi hanno dimensioni molto piccole, è possibile sequenziare i genomi di molti virus e batteri in contemporanea.
In altre parole, a seconda delle dimensioni delle sequenze che si desidera analizzare, è possibile eseguire l’analisi di più di un campione alla volta. Non è infrequente, ad esempio, sequenziare l’intero esoma (exome sequencing) di almeno un paio di soggetti in un’unica corsa. Similmente, in un laboratorio di microbiologia, poiché i genomi dei microorganismi hanno dimensioni molto piccole, è possibile sequenziare i genomi di molti virus e batteri in contemporanea.
L’analisi in parallelo delle sequenze di più di un campione è
detta in gergo multiplexing. Per poter procedere al multiplexing, è necessario
aggiungere ai frammenti di ciascun campione una sequenza specifica, detta etichetta
o sequenza barcode. La sequenza barcode consente di identificare in modo
univoco tutti i frammenti di DNA di uno stesso individuo (o di uno stesso
microorganismo). Le librerie di DNA dei diversi individui così preparate possono poi essere unite in un'unica provetta per la reazione di sequenziamento in multiplexing. Tutte le reads ottenute durante la reazione conterranno anche la
sequenze barcode (che vengono effettivamente amplificate e sequenziate né più
né meno come le sequenze di DNA a cui sono attaccate). Identificando le
sequenze barcode è poi possibile procedere al de-multiplexing delle reads, cioè
alla loro separazione sulla base dell’appartenenza ai diversi individui. Le
reads così seperate vengono poi allineate con le reference sequences dei
database fino ad ottenere la sequenza reale di ciascun campione analizzato. Tutto
questo, che un tempo sarebbe stato possibile solo tramite Sanger sequencing a
costi esorbitanti e in parecchie settimane, è ora fattibile in un paio di
giorni al massimo. Le macchine NGS, inoltre, riducono al minimo l’intervento
umano nell’analisi, poiché non forniscono un elettroferogramma da interpretare,
ma la sequenza vera propria dei nucleotidi e la lista delle varianti identificate. Il processo di alignment con le
reference sequences e l’operazione di variant calling (cioè di identificazione
delle varianti) sono infatti completamente automatizzate. Non solo: anche la quantità di DNA necessaria
è molto inferiore: basti pensare che soli 30 ng di DNA possono essere sufficienti
ad ottenere un’intero esoma!
Un commento sull’affidabilità dell’analisi: soprattutto
per grandi quantità di sequenze da analizzare, Il sequenziamento NGS è noto per
essere tendenzialmente meno sensibile e meno specifico (in altre parole meno
preciso) del sequenziamento classico col metodo Sanger. Tuttavia, laddove la
macchina NGS venga utilizzata per processare un solo campione o un numero
relativamente basso di frammenti, il livello di amplificazione che si può
ottenere (vale a dire il livello di capture)
può essere talmente elevato (fino a 1000x !) da rendere l’analisi NGS
praticamente precisissima.
Argomenti correlati:
Argomenti correlati:
Nessun commento:
Posta un commento