Analisi delle sequenze
L'analisi delle sequenze in biologia molecolare comporta l'identificazione della sequenza dei nucleotidi in un acido nucleico, o degli aminoacidi in un peptide o in una proteina. Una volta ottenuto un campione, le sequenze di DNA possono essere prodotte automaticamente dalla macchina e il risultato visualizzato sul computer. L'interpretazione di questi risultati è ancora un compito dell'uomo.
Le informazioni provenienti dall'analisi delle sequenze sono utilizzate in molti campi della biologia. Fornisce informazioni sulla relazione tra organismi individuali o tra gruppi di organismi. Mostra quanto sono strettamente correlati.
Sequenza di coppie di basi del DNA
Una sequenza di DNA è la sequenza di nucleotidi in una molecola di DNA. È scritta come una successione di lettere che rappresentano la struttura primaria di una molecola o filo di DNA. Se funzionale, tale sequenza porta informazioni per la sequenza di amminoacidi in una molecola proteica. Le lettere possibili sono A, C, G e T, che rappresentano le quattro basi nucleotidiche di un filamento di DNA - adenina, citosina, guanina, timina. Le sequenze sono stampate una accanto all'altra, senza spazi vuoti, come nella sequenza AAAGTCTGAC.
Lo studio dell'RNA e delle proteine è più complesso. La struttura generale del DNA è semplice e prevedibile (doppia elica). Lo studio dell'RNA e delle proteine deve includere uno studio della loro struttura tridimensionale, che è varia e influenza il loro funzionamento. In una certa misura questo può essere aiutato dal computer, ma deve essere verificato in ogni caso.
Le informazioni sulle sequenze sono conservate in banche dati. Dallo sviluppo della produzione rapida di sequenze di geni e proteine durante gli anni 90, il tasso di aggiunta di nuove sequenze alle banche dati aumenta continuamente.
Punteggio
L'analisi completa del genoma è stata fatta su più di 800 specie e ceppi. Il lavoro è fatto da una macchina, il sequenziatore di DNA, che analizza i segnali luminosi dei fluorocromi attaccati ai nucleotidi. Questo tipo di lavoro sta diventando gradualmente meno costoso.
"Ci sono attualmente [2009] più di 90 specie di vertebrati con sequenze del genoma intero finite, in corso o in fase di pianificazione avanzata.
Totali grezzi
A partire da dicembre 2012, l'analisi del genoma intero è stata completata su circa 800-900 specie viventi e ceppi di specie. I numeri sono approssimativi e mutevoli.
- Animali: 111 specie
- Piante: 53 specie
- Funghi: 81 specie
- Protisti: 50 specie
- Archaea: 139 specie e ceppi
- Batteri: ~4/500 specie e ceppi
Sequenza del DNA umano
Il genoma umano è memorizzato su 23 coppie di cromosomi nel nucleo della cellula e nel piccolo DNA mitocondriale. Oggi si sa molto sulle sequenze di DNA che si trovano sui nostri cromosomi. Ciò che il DNA fa effettivamente è ora parzialmente noto. L'applicazione pratica di questa conoscenza è appena iniziata.
Il Progetto Genoma Umano (HGP) ha prodotto una sequenza di riferimento che è usata in tutto il mondo in biologia e medicina. Nature ha pubblicato il rapporto del progetto finanziato pubblicamente, e Science ha pubblicato l'articolo di Celera. Questi articoli descrivevano come la bozza della sequenza era stata prodotta e davano un'analisi della sequenza. Bozze migliorate furono annunciate nel 2003 e nel 2005, riempiendo fino al ≈92% della sequenza.
L'ultimo progetto ENCODE studia il modo in cui i geni sono controllati.
Lavoro forense
Non è necessario avere sequenze del genoma intero per il lavoro forense, come l'identificazione di un criminale dalle tracce di DNA lasciate sulla scena del crimine, o per i casi di paternità. Attualmente il sequenziamento del genoma intero è ancora molto costoso, ma fortunatamente sono disponibili metodi più semplici ed economici.
L'idea di base è di guardare certi loci (luoghi) nel genoma che sono altamente variabili tra le persone. Circa 10-15 di questi loci sono necessari per una corrispondenza, e i dettagli legali differiscono da paese a paese. Una corrispondenza tra un campione e un individuo sospetto rende estremamente probabile che l'individuo fosse la fonte del campione. Questa prova sarebbe quindi la base del caso dell'accusa per un crimine. Un'analisi simile dimostrerebbe che un uomo è molto probabilmente il padre di un bambino. Questo è davvero un modo moderno di fare ciò che veniva fatto con i gruppi sanguigni prima che si potessero analizzare i dettagli del DNA. I metodi sono stati sviluppati principalmente dal lavoro di Alec Jeffreys.
Il DNA di ogni persona contiene due alleli di un particolare gene o "marcatore": uno dal padre e uno dalla madre. I 'marcatori' sono geni scelti per avere un numero di alleli diversi che si verificano frequentemente nella popolazione. La seguente tabella proviene da un esperimento commerciale di test di paternità del DNA. Mostra come la parentela tra genitori e figlio è dimostrata con cinque marcatori:
Marcatore del DNA | Madre | Bambino | Presunto padre |
D21S11 | 28, 30 | 28, 31 | 29, 31 |
D7S820 | 9, 10 | 10, 11 | 11, 12 |
TH01 | 14, 15 | 14, 16 | 15, 16 |
D13S317 | 7, 8 | 7, 9 | 8, 9 |
D19S433 | 14, 16.2 | 14, 15 | 15, 17 |
I risultati mostrano che il DNA del bambino e quello del presunto padre corrispondono per questi cinque marcatori. I risultati del test completo hanno mostrato questa correlazione su 16 marcatori tra il bambino e l'uomo testato. Se un caso viene esaminato in tribunale, uno scienziato forense fornirebbe prove sulla probabilità di ottenere quel risultato per caso.
Test del DNA negli Stati Uniti
Ci sono leggi statali sul profilo del DNA in tutti i 50 stati degli Stati Uniti. Informazioni dettagliate sulle leggi sui database in ogni stato possono essere trovate sul sito web della Conferenza nazionale delle legislature statali.
Un chimico della U.S. Customs and Border Protection legge un profilo di DNA per scoprire da dove viene una merce.
DNA antico
Il DNA antico è stato recuperato da alcune fonti. Il record di sopravvivenza del DNA adatto all'analisi delle sequenze è di 700.000 anni. Uno scheletro di cavallo sepolto nel permafrost ha fornito delle ossa con del DNA sopravvissuto. La sequenza era completa solo al 70%, ma era sufficiente per i ricercatori per dire "Non assomiglierebbe a un cavallo come lo conosciamo... ma ci aspetteremmo che fosse un cavallo con una sola punta". Per il confronto, i ricercatori avevano accesso a sequenze di DNA di cavalli moderni, asini e del cavallo di Przewalski.
Pagine correlate
- George Church
- Walter Gilbert
- John Sulston
- Fred Sanger
- ENCODE: l'analisi completa del genoma umano
- Genoma umano
- Genomica completa
- Bioinformatica