Progetto Genoma

13.GENETICA

13.2 PROGETTO GENOMA

Science, 15 Jan 93, Vol. 259, pag. 300 - Christopher Anderson - Numerose compagnie stanno investendo capitali sul progetto Genoma nella prospettiva di brevettarne le applicazioni. Iniziato con soli investimenti pubblici, il progetto attira oggi l’interesse privato. Ci sono oggi coinvolte più di 12 compagnie.

Science, 1 Oct 93, Vol. 261, pg. 20 - Leslie Roberts - Il programma Genoma umano, ormai a livello internazionale, viene finanziato negli USA dalla DOE e dallo NIH ed è alla ricerca di ulteriori fondi se si vuole mantenere la data di completamento entro il 2005. Nel 1988, quando il progetto fu pianificato, la previsione fu di 15 anni al costo di 3 miliardi di US$ o 200 milioni di US$ l’anno. In realtà negli anni ‘92 e ‘93 il budget totale è stato di 165 milioni di US$ l’anno e non si è tenuto conto dell’inflazione. Si spera di accelerare i lavori con il progresso nei sistemi automatici di sequenziamento. Si assiste inoltre ad uno spostamento dell’interesse dei settori privati verso l’identificazione dei 100000 geni della mappa umana ed in particolare quelli responsabili delle malattie. La discussione sulla brevettabilità dei geni è anche un indice dell’interesse pratico suscitato dal progetto.

Science, 1 Oct 93, Vol. 261, pg. 43 - Francis Collins - Il progetto Genoma umano negli USA fa parte di uno sforzo internazionale per la determinazione delle sequenze del DNA del genoma umano e di alcuni organismi di riferimento. Una pianificazione dettagliata è stata fatta per i primi 8 anni fino al 1998 dei 15 previsti per il completamento. Il programma prevede la creazione di una prima mappa costituita dai Sequence Tagged Site (STS) da completarsi in 2 - 3 anni con intervalli di circa 300 o 100 kb (migliaia di basi). Le tecniche devono migliorare per ottenere una capacità di sequenziamento di almeno 50 Mb per anno con metodi automatici (il genoma umano comprende sequenze per un totale di 3 miliardi di basi). Un’attività parallela è quella della mappatura di alcuni organismi modello come lo Escherichia coli (E-coli), il Saccharomyces cerevisiae il Caenorhabditis elegans (C-elegans) e la Drosophila. Anche la mappa genetica dl topo è fra gli obiettivi. Uno speciale team studia le implicazioni etiche, legali e sociali (ELSI) per preparare il grande pubblico alle conseguenze potenziali delle nuove conoscenze e per evitare discriminazioni genetiche. Tutti i risultati del progetto dovranno essere utilizzabili dalla comunità.

Science, 1 Oct 93, Vol. 261, pg. 47 - A. Jamie Cuticchia - Il Progetto Genoma richiede oggi, e sempre più nel futuro, il facile accesso e manipolazione di un enorme numero di dati. Ci sono tre databases di primaria importanza: sequenze del DNA (GenBank), informazioni della mappa dei cromosoni (Genoma Data Base) e sequenza e struttura delle proteine (Proteine Information Resource). Attualmente questi database sono amministrati indipendentemente da enti diversi. L’accesso si ha attraverso reti telematiche con protocolli semplici quali il GOPHER e il WAIS (Wide Area Information Service). Si sente la necessità di un protocollo standard come lo SQL (Structured Query Language) per l’accesso contemporaneo dai diversi database come da un unico database virtuale. Inoltre i diversi centri di ricerca negli USA hanno instaurato dei server FTP (File Tranfer Protocol) per mettere in comune i dati. Vi sono molti piccoli centri che producono mappe di alcune regioni di cromosoni di loro interesse e queste devono essere accumulate nel database primario in forma compatibile.

Science, 1 Oct 93, Vol. 261, pg. 57 - Neal G. Copeland - Il topo fra tutti i mammiferi è stato preferito per le analisi genetiche a causa del suo breve tempo di gestazione e per la facilità di controllare gli incroci; inoltre è un ottimo modello per seguire il propagarsi di malattie genetiche come anemie, disfunzioni immunitarie, disordini neurologici, anomalie riproduttive e di nascita e malattie come il cancro, il diabete e l’arteriosclerosi. Nel Progetto Genoma Umano è incluso lo sviluppo della mappa genetica del topo. Il topo ha 40 cromosoni mentre l’uomo ne ha 46, in realtà i cromosoni diversi nel topo sono 19 più quelli X Y, nell’uomo 22 più sempre X e Y. Sono state messe in confronto le mappe genetiche del topo e dell’uomo per trovare i geni omologhi (la Tab. 1 nell’articolo riporta questo confronto). Poiché la suscettibilità a molti disordini genetici è controllata da più di un gene, una volta individuati i geni sospetti di una malattia nel topo, si può passare all’indagine sui geni omologhi dell’uomo.

Science, 22 Oct 93, Vol. 262, pg. 502 - Peter Aldhous - L’esplosione della quantità di dati prodotti dalle biotecnologie ha portato al diffondersi degli addetti alla bioinformatica. Infatti i ricercatori hanno bisogno di accedere istantaneamente a tutte le informazioni del campo di loro interesse normalmente disponibili in parecchi database di biologia molecolare che non comunicano fra di loro. Un sistema integrato di accesso istantaneo è l’obiettivo del National Center for Biotechnology Information (NCTI) del NIH USA e della sua controparte europea, European Bioinformatics Institute (EBI). Il primo problema è di convertire tutti i records in un formato standard, ma le proposte sono molteplici e la completa standardizzazione si dimostra illusoria. Si cerca piuttosto di creare una federazione di banche dati che non richieda la conversione dei formati e lasci maggiore autonomia. Anche una tale federazione richiederà però almeno 5 anni.

Science, 6 May 94, Vol. 264, pg. 766 - Christopher Anderson - Mentre ancora è in corso la mappature del genoma umano supportata in USA dallo NIH e dal DOE, si sta sviluppando un’intensa ricerca sui geni connessi a particolari malattie. Una diagnostica genetica su un singolo gene può costare più di 1000 US$ e, poiché l’industria è restia a spendere prima che il mercato lo richieda, la scorsa settimana il Dipartimento del Commercio USA ha annunziato un programma di 5 anni da 145 milioni di US$ per sviluppare una tecnologia di diagnostica del DNA per uso commerciale. Questa iniziativa fa parte dello Advanced Technology Program (ATP) che ha già raggiunto un totale di 745 milioni di US$ di investimenti commerciali anche in campi diversi.

Science, 3 Jun 94, Vol. 264, pg. 1404 - Robert F. Service - I progressi nella mappatura del genoma umano e di quello del topo, che serve come modello per molte malattie umane, fanno ritenere di poter raggiungere, entro la fine dell’anno, l’obiettivo dei 5000 marker nel genoma umano e dei 6000 marker in quello del topo. La disponibilità di un’alta densità di marker è fondamentale nella ricerca sulle malattie genetiche.

Science, 30 Sep 94, Vol. 265, pg. 2031 - David R. Cox - Un importante obiettivo del Progetto Genoma Umano (HGP) negli USA è di costruire entro il 1998 una mappa completa di marker distanziati di 100 kilobasi consistente in 30000 siti ordinati come primo passo per localizzare ed isolare ogni sequenza di DNA di interesse. Attualmente i contributi dei vari gruppi di ricercatori usano metodi diversi di mappatura ed il problema consiste nel rendere compatibili i vari metodi.

Science, 30 Sep 94, Vol. 265, pg. 2035 -Bartha Maria Knoppers - Lo Human Genome Project (HGP) ha suscitato intensi dibattiti a livello internazionale per definire le linee guida atte ad armonizzare le legislazioni nazionali. Cinque sono i principi base per il consenso: autonomia, privacy, giustizia, equità e qualità.

Autonomia: i testi genetici devono rimanere personali e non devono essere usati per discriminare gli individui; molti test genetici sono solo predittivi e probabilistici ed il diritto a non sapere fa parte dell’autonomia; controversi rimangono i test sugli embrioni prima di impiantarli, ma sono proibiti solo in Germania.

Privacy: tutte le prove devono essere confidenziali e ne è proibita la comunicazione a terzi in particolare alle compagnie di assicurazione ed agli uffici assunzioni; si raccomanda che informazioni sullo stato di salute e di carattere genetico non devono essere usati per negare copertura di assistenza medica.

Giustizia: viene affermato il rispetto delle popolazioni più vulnerabili per capacità e cultura; il principio delle modifiche genetiche per il miglioramento delle future generazioni viene dibattuto e si va dalla proibizione assoluta ad una preventiva discussione degli aspetti tecnici ed etici; tuttavia Austria, Francia, Germania, Norvegia e Svizzera lo hanno proibito per Costituzione.

Equità: esiste un potenziale pericolo che non tutti abbiano un uguale accesso ai test ed alle informazioni di carattere genetico e che si crei una separazione di fatto per minoranze etniche.

Qualità: i responsi genetici devono essere dati secondo criteri universali di accuratezza, specificità ed efficacia.

Science, 14 Oct 94, Vol. 266, pg. 208 - Eliot Marshall - In una riunione dei maggiori ricercatori del progetto Genoma Umano (HGP) tenuta a Washington D.C. la scorsa settimana, si sono discussi i problemi portati dal mondo commerciale nel progetto. Uno di questi problemi è quello dei brevetti che gravitano intorno alle scoperte dei geni che hanno applicazioni terapeutiche. Sono in corso per esempio azioni legali per assegnare i diritti di brevetto sulla scoperta del gene BRCA1 a cui è legata la suscettibilità del cancro al seno. La ricerca era stata condotta da un megateam di 45 persone principalmente fra l’Università dello Utah supportata dallo NIH e la Myriad Genetic Inc. e nell’azione legale sembra che quest’ultima sia favorita. Un problema dibattuto è quello del monopolio di un database privato sullo Expressed Sequence Tag (EST) che sta creando una barriera al libero scambio di informazioni tanto che i ricercatori parlano di spendere milioni di dollari per duplicarlo e renderlo così pubblico. La Human Genome Organization (HUGO) ha pianificato una serie di riunioni nei prossimi 4 mesi per discutere ancora i problemi.

Science, 13 Jan 95, Vol. 267, pg. 172 - Rachel Nowak - Nel 1990, nell’ambito del Progetto Genoma, è stata data ufficialmente priorità alla determinazione delle sequenze dello Escherichia Coli la cui complessità è di 4,7 milioni di coppie di basi. Questo rappresentava un buon test prima di concentrare gli sforzi sul genoma umano la cui complessità è di circa 3 miliardi di coppie di basi, e si pensava di raggiungere l’obiettivo in 2 anni. Il piano era ottimistico e nel 1993 si spostò la fine al 1998, attualmente però si sono risolte solo poco più di 0.5 megabasi. Attualmente vi lavorano le università del Wisconsin e quella di Haward ed un consorzio giapponese.

Science, 10 Feb 95, Vol. 267, pg. 783 - Eliot Marshall - Da un recente incontro degli addetti al progetto Genoma Umano (HGP) è uscito un messaggio ottimistico: raggiungere l’obiettivo di sequenziare il genoma umano, 3 miliardi di basi del DNA, entro il 2001, cioè 5 anni prima del previsto. John Sulston del Sanger Center di Cambridge, UK, e Robert Waterston della Washington University, USA, intendono muoversi in modo pragmatico sfruttando i metodi di sequenziamento attualmente noti. Con l’attuale capacità e facendo lavorare in parallelo tre laboratori, si potrà sequenziare il 99% del genoma umano in 5 anni con un’accuratezza complessiva del 99,9% e del 99,99% nelle aree più importanti.

Science, 16 Jun 95, Vol. 268, pg. 1560 - Nigel Williams - Questa settimana in una conferenza a Lisbona sulla genetica un gruppo di ricercatori ha annunziato che entro pochi mesi verrà sequenziato l’intero genoma del Saccharomyces cerevisiae, microrganismo del lievito di birra. Fino ad ora sono stati sequenziati i genoma di virus e batteri, ma questo sarà il primo organismo vivente libero, non parassita, appartenente alla specie degli eucarioti ad essere sequenziato. Il genoma contiene fra 12 e 13 mila kilobasi ed è molto ricco in geni che codificano proteine.

Science, 28 Jul 95, Vol. 269, pg. 468 - Rachel Nowak - The Institute for Genomic Research nel Maryland e l’Università John Hopkins di Baltimora hanno completato la mappatura del batterio Haemophilus influenzae, una sequenza di 1,8 megabasi. Si tratta di un batterio benigno che può provocare infezioni all’orecchio e meningiti ed è il primo organismo vivente libero di cui è stato determinato il genoma. La conoscenza di una sequenza completa può servire a identificare nuovi geni ed accrescere le nostre conoscenze sulla biologia dell’evoluzione attraverso il confronto con altri genomi, esplorare l’organizzazione dei genoma e comprendere il meccanismo di controllo dei geni. Fra le applicazioni dirette vi sono quelle della clonatura dei geni e lo studio delle proteine da essi prodotte per comprenderne il ruolo e creare vaccini ed enzimi industriali.

Science, 28 Jul 95, Vol. 269, pg. 496 - Robert D. Fleischmann - Viene riportata l’intera mappatura del batterio Haemophilus influenzae, una sequenza di 1830137 coppie di basi. Ad oggi sono stati completamente sequenziati diversi genomi di virus ed organelli. I primi sono stati due batteriofagi rispettivamente con 5386 e 48502 coppie di basi, quindi il Cytomegalovirus di 229 k-basi, il genoma del vaccino da 192 k-basi ed i genomi del mitocondrial (187 k-basi) e del cloroplasto (121 k-basi) del Marchantia polymorpha. Il genoma della variola (vaiolo) da 186 k-basi, è stato il primo ad essere sequenziato con tecnologia automatica. Attualmente sono in corso le mappature della Drosophila melanogaster, dello Escherichia coli, del Saccharomyces cerevisiae, del Bacillus subtilis, del Caenorhabditis elegans e dell’Homo sapiens.

Science, 15 Sep 95, Vol. 269, pg. 1504 - Dennis Normile - Questo mese il governo giapponese ha annunziato il finanziamento di 4 gruppi di ricerca destinati al sequenziamento di alcuni cromosomi selezionati del genoma umano. I gruppi appartengono alla Tokai University per il cromosoma 6 legato alla risposta immunitaria, all’università di Tokyo (2 gruppi) per il cromosoma 3 ed ai geni soppressori dei tumori e per il cromosoma 21 connesso alla sindrome di Dawn e l’ultimo gruppo dell’università di Keio per il cromosoma 21 ed il 22 connesso alla risposta immunitaria. Ogni team è costituito tipicamente da non più di una dozzina di scienziati e tecnici. Si spera che il Giappone possa sequenziare da 2 a 3 megabasi per anno.

Science, 20 Oct 95, Vol. 270, pg. 397 - Claire M. Fraser - Viene data la mappa completa della sequenza genetica del Mycoplasma genitalium che sembra essere il più piccolo organismo autoreplicante (580070 coppie di basi). Una comparazione con il genoma dello Haemophilus influenzae ha messo in evidenza un gran numero di geni comuni. Questi confronti forniscono un gran numero di informazioni sull’evoluzione dei geni, delle loro famiglie e sulle diversità della vita.

Science, 20 Oct 95, Vol. 270, pg. 410 - Jonathan Hodgkin - Viene pubblicata la mappa del genoma del Nematode Caenorhabditis elegans. Il genoma contiene 100 milioni di coppie di basi, circa 1/30 del genoma umano, ed il lavoro di mappatura è iniziato nel 1984. A metà 1995 è stata sequenziato circa un terzo del genoma completo con un costo di circa 50 cents per base ed un’accuratezza del 99,99%. Vi sono circa 13100 geni dei quali circa 3000 sono quelli essenziali e sembra che vi sia molta ridondanza nei geni, gran parte di essi ha funzioni universali che si possono applicare anche agli organismi multicellulari.

Science, 1 Dec 95, Vol. 270, pg. 1432 - Dennis Normile - Due anni fa il Ministry of International Trade and Industry (MITI) giapponese ha creato un gruppo governo-industria per sviluppare tecnologie automatiche nella ricerca del genoma, creare una conoscenza di base fra i membri del consorzio ed un gruppo di esperti. Il contributo finanziario del governo, circa il 60%, è considerato un investimento e tutti si aspettano un ritorno e dei profitti. Un problema nasce su come legalizzare una collaborazione fra industrie private ed università che per statuto in Giappone non possono lavorare direttamente per i privati e trasferire le proprietà intellettuali.

Science, 22 Dec 95, Vol. 270, pg. 1919 - Jean Marx - Dopo 3 anni di lavoro un team di biologi dell’Institute for Biomedical Research del Massachusetts ha emesso una mappa del genoma umano che contiene più di 15000 marker di sequenze, circa metà di tutte le sequenze di marker previste dallo Human Genome Project (HGP). La mappa dei marker è il passo intermedio per sequenziare le circa 3 miliardi di coppie di basi che costituiscono il genoma umano.

Science, 9 Feb 96, Vol. 271, pg. 749 - Science Scope - Lo Howard Hughes Medical Institute (HHMI) ha pianificato di investire 2,3 milioni di US$ nei prossimi 2 anni per la mappa genetica del topo. Lo scopo finale sarebbe di identificare i geni del topo equivalenti a quelli umani e creare nel topo un modello delle malattie umane. Sarà interessante verificare quanta similitudine c’è fra i geni del topo e dell’uomo.

Science, 5 Apr 96, Vol. 272, pg. 27 - Nigel Williams - Il Britain’s Wellcome Trust, una fondazione privata per la ricerca biomedicale, ha sponsorizzato lo sforzo di sequenziare il genoma degli organismi responsabili della tubercolosi e della malaria. Il Mycobacterium tubercolosis è stimato avere una complessità di 4,5 milioni di coppie di basi, ma ha un genoma per due terzi costituito dalle due basi guanina e citosina il ché rende difficile il processo. Il secondo obiettivo è il Plasmodium falciparum della malaria con 14 cromosomi che pone un problema simile perché l’80% del genoma è costituito dalle altre due basi adenina e timina. Il Saccharomyces cerevisiae del lievito di birra, che è stato recentemente sequenziato in modo completo, aveva una complessità di 14 milioni di coppie di basi e 16 cromosomi.

Science, 23 Aug 96, Vol. 273, pg. 1043 - Virginia Morell - Nel 1982 il sommergibile Alvin, a 3 km sotto l’Oceano Pacifico, in un camino idrotermale, ha scoperto l’esistenza di microrganismi che producono metano riconosciuti come appartenenti agli Archaea, una forma primitiva di vita distinta dai batteri (procarioti, senza nucleo) e dagli eucarioti (con nucleo). Questo microrganismo è stato chiamato Methanococcus jannaschii e vive in ambienti a temperature fra i 48 e 94 °C e pressioni di 200 atmosfere. Il M. jannaschii è stato recentemente sequenziato ed il genoma consiste in un singolo grande cromosoma di 1682 geni ed altri due elementi extracromosoma con 44 geni ciascuno. Alcuni geni sono simili a quelli dei batteri ed altri assomigliano chiaramente a quelli degli eucarioti.

Science, 27 Sep 96, Vol. 273, pg. 1788 - Eliot Marshall - Ora che il progetto Genoma Umano è giunto in una fase avanzata per identificare i 3 miliardi di coppie di basi che lo costituiscono, ci si rende conto che le librerie in via di costituzione derivano da un numero limitato di donatori: tre uomini ed una donna. Questo anche perché le differenze genetiche fra individui possono essere tali da rendere difficile allineare le sequenze e determinare se un’anomalia è una reale mutazione o un errore di sequenza.

Science, 25 Oct 96, Vol. 274, pg. 488 - Eliot Marshall - Fin dall’ottobre del 1988 allo Human Genome Project presso il NIH era stato deciso di dedicare una parte del budget allo studio degli impatti che le ricerche genetiche possono avere sulla società. Negli ultimi 6 anni si è avviato il programma ELSI (ethical, legal and social implications) che è stato imitato in Europa ed in Giappone. Oggi ELSI impegna il 5% del budget del National Center for Human Genome Research (NCHGR).

Science, 25 Oct 96, Vol. 274, pg. 496 - Patricia Kahn - Poco più di due anni fa i genetisti hanno scoperto il gene chiamato BRCA1 collegato al cancro ereditario del seno e delle ovaie e 15 mesi dopo se ne scoprì un secondo: il BRCA2. La scoperta, molto pubblicizzata, diffuse molte speranze, ma i risultati sono stati scarsi. Le funzioni dei due geni sono poco comprese e ci sono molte incertezze sulla stima del rischio. Il BRCA1 è un gene soppressore dei tumori ed ambedue le sue copie dovrebbero essere inattive per produrre il cancro. Nei prossimi 4 anni verranno raccolte cellule del sangue e del cancro di circa 6000 donne e di 20000 loro parenti con diverso grado di rischio familiare e questi campioni saranno aggiornati ogni anno. Alla fine i risultati potrebbero indicare l’influenza delle mutazioni di questi geni e come proteggersi.

Science, 25 Oct 96, Vol. 274, pg. 536 - Eric S. Lander - Il programma dello Human Genome Project prevede tre fasi: produzione della mappa genetica, produzione della mappa fisica ed infine mappa completa della sequenza dei nucleidi. Negli ultimi anni i primi obiettivi sono stati raggiunti, il genoma invece è stato sequenziato solo per l’1%. Il completamento si prevede entro il 2005. Accanto a questo programma vi sono da perseguire altri 10 obiettivi per passare dalla fase strutturale del genoma a quella funzionale. 1) Risequenziare molte parti del DNA dell’uomo e del topo per scoprire suscettibilità alle varianti e predisposizioni. 2) Sistematica identificazione di tutte le varianti comuni dei geni umani. 3) Sequenze di altri organismi per stabilire i diversi rami dell’albero della vita prodotto dall’evoluzione. 4) Monitoraggio simultaneo dei geni. 5) Dispositivi per manipolare le sequenze. 6) Monitoraggio dello stato e delle modifiche delle proteine. 7) Catalogo sistematico delle interazioni fra proteine. 8) Identificazione della configurazione di tutte le principali proteine. 9) Attenzione agli aspetti etici, legali e sociali (ELSI).10) educazione pubblica.

Science, 25 Oct 96, Vol. 274, pg. 546 - A. Goffeau - Il genoma del Saccharomyces cerevisiae è stato completamente sequenziato con collaborazione internazionale. La sequenza di 16 cromosomi è formata di 12068 kilobasi con 5885 geni che codificano proteine, circa 140 geni che specificano il ribosoma RNA, 40 geni delle molecole RNA del nucleo e 275 geni per lo RNA di trasferimento. Il genoma mostra un’apparente considerevole quantità di ridondanza genetica.

Science, 14 Feb 97, Vol. 275, pg. 923 - Wade Roush - In parallelo al Progetto Genoma Umano (HGP) ancora in corso sono state decifrate le mappe genetiche di organismi semplici come il batterio Escherichia coli, quello del lievito di birra Saccharomycies cervisiae, del verme Caenorhabditis elegans, del moscerino della frutta Drosophila melanogaster e del topo di laboratorio. Ora si sta aggiungendo i pesce zebra Daniorerio che contiene circa 2400 geni. Il Daniorerio è un vertebrato e produce migliaia di embrioni trasparenti che i ricercatori possono osservare durante lo sviluppo del cervello, del cuore e di altri organi verificando l’effetto di mutazioni provocate. Il progetto potrebbe essere completato con solo 350 mila US$ ed avrebbe notevoli ricadute sullo stesso HGP.

Science, 27 Jun 97, Vol. 276, pg. 1960 - Jon Cohen - Nelle prossime settimane alcuni membri del Congresso USA proporranno con una voce del bilancio di lanciare un nuovo progetto genoma focalizzato su grano e granoturco. Lo scopo è di produrre uno sforzo per migliorare la resa di queste piante e la loro resistenza alla siccità, al sale ed alle malattie in previsione di un raddoppio della popolazione entro il 2050. Quattro sono le specie vegetali che forniscono il 60% del cibo per l’umanità: il grano, il riso, il granoturco e le patate ed al momento non vi sono strategie per aumentarne la produzione. Il grano ha un genoma complesso di più di 3 miliardi di coppie di basi quindi comparabile con il genoma umano, ci sono anche un gran numero di sequenze ripetute che probabilmente contengono informazioni inutili. Il progetto sarà diretto dallo US Department of Agricolture (USDA) con uno steering committee finanziato dalla NSF che farà la richiesta per l’anno fiscale 1999 che inizia a ottobre 1998. Il progetto potrebbe essere esteso anche al riso che ha un genoma molto meno complesso di soli 430 milioni di coppie di basi. La tabella seguente da un confronto fra le complessità di diversi genomi.


SpecieGenoma:	mio di coppie di basi	Numero di geni previsto
Mycoplasma genitalium	0,58	482
Haemophilus influenzae	1,83	1727
Escherichia coli	4,72	4307
Saccharomycies cerevisiae	12,50	6000
Caenorhabditis elegans	100	13100
Arabidopsis thaliana	150	20000
Oryza sativa (riso)	430	30000
Sorghum bicolor (sorgo)	760	30000
Zea mays (mais)	2000	30000
Homo sapiens	3000	100000
Tricum aestivum (grano)	16000	30000

Science, 25 Jul 97, Vol. 277, pg. 478 - Nigel Williams - Dopo 5 anni di lavoro, un team di ricercatori di 37 laboratori nell’Unione Europea e in Giappone ha annunziato di aver risolto il genoma del Bacillus subtilis con una sequenza di 4,2 milioni di coppie di basi. Il bacillo è importante come sorgente di enzimi usati nei detergenti, lieviti e fabbriche di vitamine. Il bacillo inoltre appartiene ad una famiglia di batteri che includono patogeni come la Straphylococcus aureus, lo Streptococco ed altri patogeni responsabili del tetano, antrace e difterite. Il programma continuerà con lo studio della funzione di tutti i circa 4000 geni del bacillo.

Science, 23 Oct 98, Vol. 282, pg. 662 - David W. Meinke - L’Arabidopsis thaliana è diventata recentemente la pianta più studiata come modello non solo per la biologia delle piante, ma anche per la struttura e le funzioni comuni a tutti gli eucarioti. L’Arabidopsis thaliana è una semplice angiosperma organizzata con 5 cromosomi e 20000 geni con un totale di circa 120 megabasi. Si è programmato di risolvere l’intero genoma entro il 2000. L’Arabidopsis thaliana è un membro della famiglia delle Cruciferae o Brassicaceae (mostarda) ed è diffusa in Europa, Asia e Nord America; il suo ciclo di vita, dalla germinazione dei semi alla formazione di una pianta, fioritura e maturazione, viene completato in 6 settimane; le foglie sono coperte da peli unicellulari, detti tricomi. Le piante mature raggiungono i 15-20 cm di altezza e producono più di 5000 semi. Fino a questo momento sono state risolte circa 30 megabasi e le ricerche hanno individuato meccanismi cellulari comuni ad altri organismi eucarioti; le ricerche si orientano sulla clonazione di geni resistenti alle malattie, produzione di piante resistenti alle alte temperature, produzione di speciali idrocarburi e stimolazione di fioritura precoce negli alberi ed altre piante con lungo ciclo di vita.

Science, 23 Oct 98, Vol. 282, pg. 682 - Francis S. Collins - Il Progetto Genoma Umano (HGP) ha completato con successo quanto pianificato negli ultimi 5 anni dal 1993 al 1998, il nuovo piano coprirà gli anni fiscali dal 1999 al 2003 ed il suo obiettivo è di completare la sequenza del genoma entro il 2003, 50mo anniversario della scoperta della struttura ad elica del DNA da parte di James Watson e Francis Crick, con 2 anni di anticipo rispetto a quanto previsto all’inizio da NIH e DOE; 1/3 del genoma sarà risolto entro il 2001. Gli sforzi sono orientati a migliorare l’efficienza delle tecniche di sequenziazione puntando sull’automazione; altri aspetti sono l’identificazione delle varianti e lo studio delle sequenze che non codificano proteine. L’analisi comparativa con i genomi di altri organismi procede in parallelo con il completamento delle sequenze dello Escherichia coli e del Saccharomyces cerevisiae e quello del Caenorhabditis elegans (1998) e della Drosophila melanogaster (2002); anche il genoma del topo è stato affrontato essendo questo mammifero cruciale per l’interpretazione delle funzioni del gene umano. L’ultimo aspetto e quello delle implicazioni etiche, legali e sociali (ELSI).

Science, 11 Dec 98, Vol. 282, pg. 2011 - Jonathan Hodgkin - Viene annunziato il completamento (quasi il 100%) della sequenza DNA del nematode Caenorhabditis elegans, un piccolo verme invertebrato di forma cilindrica, primo fra gli organismi multicellulari ad essere sequenziato e secondo fra gli organismi eucarioti dopo il Saccharomyces cerevisiae. La sequenza è costituita da 97 milioni di coppie di basi, circa 1/30 di quella del genoma umano, con più di 19000 geni; più del 40% delle proteine prodotte da questi geni sono simili a quelli di altri organismi. Si hanno ora nuovi elementi per una ricerca comparativa e funzionale per capire l’organizzazione delle informazioni genetiche negli organismi complessi.

Science, 16 Apr 99, Vol. 284, pg. 406 - Eliot Marshall - Dieci grandi compagnie farmaceutiche ed un finanziamento inglese spenderanno 45 milioni di US$ per creare e rendere disponibile un archivio delle variazioni genetiche umane. Scopo del progetto è di individuare i punti variabili del codice genetico umano, noti come “single nucleotide polymorphisms” (SNP), e creare un database per permettere la determinazione dei rischi genetici di malattie e ipersensibilità alle medicine. Il Consorzio SNP (o TSC) sarà un’organizzazione non profit e pubblicherà i dati su Internet. L’obiettivo della ricerca è di trovare 300000 SNP in 2 anni, uno ogni 1000 coppie di basi e determinare la loro posizione nel genoma. Il costo stimato del progetto è di 40 milioni di US$.

Science, 24 Mar 2000, Vol. 287, pg. 2136 - Robert F. Service - Nonostante i molti dubbi avanzati dai ricercatori del genoma umano, sembra che la Celera Genomics Corp. di Rockville, Maryland, sia a pochi mesi dal completamento del genoma umano. Nel 1998 la Celera si era accordata con la PE Biosystems specializzata nel progetto e costruzione di strumentazione per sequenziatori veloci di DNA ed aveva pianificato il completamento del genoma umano entro il 2001. Ora la Celera si lancia verso una nuova frontiera: la “proteomica” cioè l’identificazione di tutte le proteine prodotte dai geni che agiscono nell’organismo umano. Questo sarà un problema ancora più complesso, ma la Celera insieme alla PE Biosystems progettano un sistema capace di identificare un milione di proteine al giorno. Si tratta di mettere insieme 100 macchine che includono spettrometri di massa ad alta velocità per l’analisi e dispositivi di separazione delle proteine oltre a potenziare la capacità dei supercomputer per gestire 500 terabytes di dati. Tutte le maggiori compagnie farmaceutiche stanno iniziando a dedicarsi all’analisi delle proteine perché sono queste che ci dicono ciò che succede realmente nella cellula. Vi sono circa 100000 geni nel genoma umano, ma questi possono produrre da 10 a 20 milioni di proteine diverse in una cellula, le proteine possono cambiare da un tessuto ad un altro e con l’età della persona. Il problema può essere affrontato solo con la forza bruta e la tecnica usata è quella dell’elettroforesi bidimensionale con la quale le proteine vengono trasferite dal tessuto su un foglio di polimero ricoperto di gelatina e separate per dimensione e carica elettrica; le proteine vengono poi divise in frammenti con l’enzima tripsina e quindi vengono identificate con lo spettrometro di massa e con le sequenze del DNA. Attualmente si riescono ad identificare circa un migliaio di proteine al giorno, ma ora la PE Biosystems garantisce di migliorare la strumentazione per arrivare a centinaia di migliaia di proteine al giorno introducendo anche un nuovo scanner laser che automatizza il processo di spostare i frammenti di proteine allo spettrometro di massa. La nuova tecnica deve ancora essere provata, ma anche nuovi sistemi sono allo studio ed i progressi in questo campo sono veloci.

Science, 14 Apr 2000, Vol. 288, pg. 242 - Eliot Marshall - J. Craig Venter, capo della Celera Genomics Corp. di Rockville, Maryland, ha rilasciato il 6 aprile un comunicato stampa annunziando che è stata completata la sequenza del genoma di un essere umano. Tutti i dati saranno disponibili verso la fine dell’anno presso il sito della Celera. Una settimana prima il National Human Genome Research Institute (NHGRI), laboratorio nonprofit, aveva annunziato che erano state sequenziate 2 milioni di basi, i 2/3 dell’intero genoma umano. Intanto la competizione si sposta su un altro fronte; la Celera ha immediatamente annunziato che le sue attrezzature si dedicheranno al genoma del topo, considerato critico per la comprensione del genoma umano, e si aspetta di finire il lavoro molto prima del 2005, data prevista dal NHGRI che lo aveva iniziato alla fine dello scorso anno.

Science, 12 May 2000, Vol. 288, pg. 939 -Elizabeth Pennnisi - Questa settimana il Consorzio Internazionale del Genoma Umano ha annunziato di aver quasi completato la prima fase del programma rendendo disponibile sulla GenBank l’85% della sequenza (promesso il 90%), ma la notizia che più ha interessato è stato il completamento della sequenza del cromosoma 21, il secondo ad essere finito dopo il cromosoma 22 che contiene 25,5 milioni di basi, completato lo scorso dicembre. Ora 62 scienziati di 13 laboratori hanno determinato le 33,5 milioni di basi del ramo lungo e le 280000 basi del ramo corto del cromosoma 21 lasciando solo 3 gap di 30000 basi ciascuno che non possono essere determinati con la corrente tecnologia. Anche il cromosoma 22 ha 10 di questi gap. Il cromosoma 21 è importante perché ad esso è legata la sindrome di Dawn nei bambini che presentano una copia aggiuntiva di questo cromosoma. Una sorpresa è stato il numero ridotto di geni trovato, 225 invece degli 800-1000 che ci si aspettava.

Science, 19 May 2000, Vol. 288, pg. 1146 - Elizabeth Pennisi. - Benché una prima sequenza del genoma umano sia quasi completa, i biologi ancora non sanno da quanti geni sia composto. Il numero generalmente accettato di geni per l’uomo è stato di 80000-100000, ma ora ricercatori di USA, Germania e Francia forniscono nuove stime tutte al di sotto di 50000. Dopo il completamento dei cromosomi 21 e 22, considerati rappresentativi dell’intero genoma, essendo il 21 il più povero di geni ed il 22 quello più ricco ed avendo complessivamente 770 geni nel 2% dell’intero genoma, si può dedurre che il numero di geni sia inferiore a 40000. Una valutazione più bassa è quella di un genetista francese che ha confrontato la sequenza del genoma umano con quella di un pesce d’acqua dolce, il Tetraodon nigroviridis, sulla base di un confronto di evoluzione comune ed ha estrapolato i geni umani fra 27700 e 34300. Un altro esperto di Seattle sulla base del cromosoma 22 pone il numero dei geni umani intorno a 35000. C’è però una corrente facente capo a The Institute for Genomic Research (TIGR) che ritiene il numero di geni legato alla complessità e, usando programmi diversi, porta i geni umani da 118000 fino a 153000.

Science, 30 Jun 2000, Vol. 288, pg. 2304 - Elizabeth Pennisi - Il 26 giugno scorso, alla Casa Bianca, Francis Collins, direttore del National Human Genome Research Institute, e J. Craig Venter della Celera Genomics of Rockville, Maryland, si sono stretti pubblicamente la mano celebrando la comune vittoria sulla decifrazione dell’intero genoma umano ed hanno confermato la loro volontà di renderne pubblici i risultati nel prossimo autunno. In realtà nessuno dei due team ha completato la decifrazione dell’intero genoma umano che ammonta a 3,12 o 3,15 miliardi di basi; il consorzio pubblico di Collins ha completato solo un 85% della codifica ed in forma provvisoria, la versione rifinita sarà disponibile entro il 2003; la versione della Celera è considerevolmente più completa grazie alle più recenti tecnologie adottate. In sostanza ambedue i documenti sono ancora in corso di sviluppo e, come ha ammesso per primo lo stesso Venter, di scarso utilizzo e devono essere completati con annotazioni che diano un senso ai miliardi di A, T, G e C che formano le coppie di basi. Per il momento queste operazioni procederanno indipendentemente e solo dopo sarà esplorata la possibilità di un team comune per paragonare le metodologie. Il lavoro del consorzio Human Genome Project è andato avanti dal 1990 dividendo i compiti e partendo con il generare le mappe aumentandone progressivamente la risoluzione poi, dal 1997, è iniziata la decifrazione della sequenza cercando di raggiungere la massima accuratezza. Successivamente però, date le limitazioni della tecnologia, il team decise di concentrarsi sulle zone che contenevano il massimo numero di geni e con un’accuratezza di un errore su 10000 basi; il completamento del progetto da 3 miliardi di US$ era fissato per il 2005. La situazione cambiò quando nel 1998 Verner, prima dipendente della NIH, creò una nuova compagnia, la Celera, e dichiarò di poter completare l’intero genoma in solo 3 anni, 4 anni prima del consorzio pubblico. Verner adottò una strategia radicale usando 300 fra le più veloci macchine sequenziatrici costruite dalla PE Biosystems Corp. ed uno dei più potenti supercomputer, in più ebbe la possibilità di partire incorporando i risultati del consorzio pubblico disponibili alla GenBank. Temendo che Venter brevettasse i suoi risultati per trarne profitto, il consorzio pubblico accrebbe gli sforzi e nel settembre del 1998 annunziò di poter completare e rendere di pubblico dominio il 90% del genoma entro il 2001, l’anno dopo la data fu anticipata alla primavera del 2000. Per disporre in sequenza i numerosissimi segmenti del genoma ottenuti indipendentemente, il consorzio adottò il criterio della sovrapposizione usando segmenti da 150000 basi detti BAC (Bacterial Artificial Chomosome) ciascuno diviso in molte parti sequenziate più volte fino ad ottenere un’accuratezza superiore a un errore su 10000 basi. L’insieme dei BAC coprono l’85% dei cromosomi, ma il loro grado di completezza è per il 24% totale, il 22% quasi totale, il 38% in bozza ed il restante in corso di decifrazione. La Celera ha diviso invece l’intero genoma in milioni di segmenti sequenziati e poi assemblati dal supercomputer, ha utilizzati i genomi di 3 donne e un uomo di etnie diverse ed ha sfruttato per confronto i dati del consorzio prelevati dalla GenBank. Anche se vi sono ancora circa 200000 intervalli vuoti, sono coperte tutte le regioni contenenti i geni ed il risultato è più completo di quello del consorzio pubblico. In ogni caso il lavoro fatto è solo un primo passo, ora si tratta di capire il significato della sequenza e molte compagnie si vanno specializzando in algoritmi e software per analizzare i risultati. Una priorità è la individuazione dei geni, la loro esatta allocazione definendo le regioni codificate e non codificate e la determinazione della funzione delle loro proteine. Il numero totale dei geni è ancora un mistero e varia da 28000 a 120000. Nei prossimi mesi verranno applicati dei programmi per la predizione dei geni e per la classificazione delle proteine. Nel frattempo la Celera sta affrontando il genoma del topo, alla fine di giugno è già a metà strada e vuole finire entro l’anno, ma in questo caso i risultati rimarranno privati.

Science, 6 Oct 2000, Vol. 290, pg. 31 - Lone Frank - Il prossimo anno il piccolo stato baltico dell’Estonia prevede di iniziare un progetto che compilerà il profilo DNA e della salute del 75% degli 1,4 milioni di cittadini. Il progetto costerà da 100 a 150 milioni di US$ e si pensa venga approvato dal Parlamento prima di Natale. Un progetto simile è stato iniziato quest’anno dal governo islandese che ha affidato l’incarico alla deCODE Genetics, ma ci sono state critiche perché non era richiesto il consenso dei cittadini, ma questi potevano solo esprimere un rifiuto, inoltre i dati sarebbero rimasti anonimi ed i cittadini non potevano avere accesso alle proprie informazioni. Al contrario nel progetto dell’Estonia i cittadini devono dare il loro consenso informato, i dati saranno identificabili da un codice ed affidati ad una fondazione no profit controllata dallo stato e potranno essere utilizzati dai proprietari che avranno anche il diritto di recedere dal consenso e farli distruggere. Il trattamento statistico di questi dati sarà una fonte preziosa di informazioni per l’industria biologica nazionale e potrà anche attrarre fondi dall’esterno.

Science, 15 Dec 2000, Vol. 290, pg. 2042 - Eliot Marshall - Il 6 dicembre è stato raggiunto un accordo fra la rivista Science e la Celera Genomics per pubblicare i risultati del genoma umano. La Celera ha rifiutato di depositare la sua sequenza nella banca dati del Consorzio Pubblico, la GenBank, per non perdere il suo vantaggio commerciale. Lo statement di accordo con Science prevede che gli enti accademici possano avere pieno accesso alla sequenza nel sito della Celera e possano scaricare segmenti da 1 megabase e pubblicare i risultati dei loro studi. Per scaricare più di 1 megabase devono sottoscrivere un agreement impegnandosi a non ridistribuire i dati. Enti commerciali devono sottoscrivere invece un accordo per non commercializzare i loro risultati. Science avrà un copia completa della sequenza Celera come garanzia della libera disponibilità. Michael Ashburner, leader dello Human Genome Project, ha espresso pubblicamente la sua contrarietà per questa frammentazione dei risultati delle ricerche e secondo voci non ufficiali farà pubblicare i risultati del Consorzio Pubblico nella rivista Nature.

Science, 15 Dec 2000, Vol. 290, pg. 2054 - Elizabeth Pennisi - Questa settimana un consorzio internazionale costituito da sei team di tre continenti ha annunziato il completamento del genoma di una pianta complessa, l’Arabidopsis thaliana. La sequenza, che è molto più accurata di quella di altri organismi multicellulari, ha mostrato per la prima volta come le piante siano geneticamente molto più complicate di quanto immaginato. La sequenza è di 125 milioni di basi e 5 cromosomi e vi sono 25500 geni da paragonare ai 13600 del moscerino della frutta e sono quindi molto vicini al numero dei geni dell’uomo. Questo risultato accelererà l’identificazione dei geni per migliorare l’agricoltura e le nostre conoscenze sulla biologia delle piante. L’analisi della sequenza ha mostrato che vi sono molte aree duplicate e si è riusciti ad assegnare in modo provvisorio le funzioni del 70% dei geni paragonandoli, insieme alle loro proteine, a quelli di altri organismi. Si è così scoperto che circa 100 geni dell’Arabidopsis hanno i loro simili in quelli umani responsabili di malattie come la fibrosi cistica ed il cancro al polmone. Molti geni coinvolti nelle funzioni cellulari, come la loro divisione, si conservano fra le specie mentre i geni di un gruppo che sovrintende alle comunicazioni da cellula a cellula sono molto diversi da quelli umani.

Science, 16 Feb 2001, Vol. 291, pg. 1182 - Leslie Roberts - Il genoma umano è il gioiello della biologia del XX secolo. Quando il progetto fu proposto per la prima volta 15 anni fa fu giudicato assurdo, pericoloso e impossibile e si disse che non esisteva ancora la tecnologia per sequenziare nemmeno un batterio. A quel tempo il genoma più grande sequenziato era quello del minuscolo virus Epstein-Barr ed aveva richiesto diversi anni di lavoro manuale di numerosi ricercatori. Il genoma umano con i suoi 3 miliardi di basi era 20000 volte più grande ed i mezzi disponibili sembravano inadeguati. Nel 1985 Robert Sinsheimer dell’Università di California riunì le migliori menti del tempo per discutere sulla fattibilità del progetto. Walter Gilbert dell’Università di Harvard, che aveva inventato la prima tecnica di sequenziazione del genoma, divenne il primo sostenitore della proposta insieme a James Watson che aveva vinto con Francis Crick il premio Nobel per la scoperta della doppia elica del DNA. La stima di 3 miliardi di US$ per l’intero progetto fece crescere gli oppositori che temevano in un massiccio spostamento di fondi dalle normali ricerche della biologia. Molti ritenevano utile una mappa del genoma e dei cromosomi per trovare i geni, ma non il decifrare tutte le coppie di basi perché in massima parte erano sequenze inutili (junk DNA) che non codificavano geni. Nel febbraio 1988 il National Research Council (NRC) approvò ufficialmente il progetto ed entro un anno vennero assegnati 200 milioni di US$ all’anno per 15 anni. Il progetto doveva iniziare con la mappa dei cromosomi e si raccomandò di analizzare anche i genomi di organismi più semplici come l’Escherichia coli, il lievito ed il Caenorhabditis elegans le cui strutture di base erano state conservate dall’evoluzione anche negli organismi più complessi. Gilbert più impaziente aveva abbandonato il NRC nel 1987 per creare la Genome Corp. per lo sfruttamento commerciale del genoma umano. Il progetto intanto progrediva e nel 1990 si era quasi completata la mappa del C. elegans. Nel 1991 il biologo Craig Venter del NIH propose di dedicarsi solo all’individuazione dei geni e presentò una nuova tecnica più veloce che avrebbe permesso di trovare 80-90% dei geni in pochi anni ad una frazione del costo stimato. Esplose un’accesa polemica fra Venter, Watson, ora capo del Human Genome Project (HGP), e la direzione del NIH che si concluse con le dimissioni di Watson e di Venter che creò The Institute of Genomic Research (TIGR). A capo dello HGP venne Francis Collins che favorì una procedura metodica e conservativa per la mappatura e la sequenziazione partendo da tratti di DNA con posizione nota nei cromosomi, dividendoli in parti, sequenziandoli ed infine riassiemandoli. Venter invece divideva in frammenti l’intero genoma e, una volta sequenziati, li riassemblava usando un computer che riconosceva le estremità. Nel maggio del 1998 Venter annunziò la sua associazione con la Perkin-Elmer Corp., leader delle macchine di sequenziazione automatica, e la creazione della Celera Genomics annunziando che avrebbe completato il genoma umano in 3 anni e con 300 milioni di US$. I leader del consorzio pubblico erano furiosi ed increduli e nel settembre del 1998 annunziarono che avrebbero completato il progetto nel 2003, due anni prima del previsto, ma sempre 2 anni dopo la Celera; nel 2001 sarebbe uscito però un draft che doveva coprire il 90% del genoma. Lo spirito di concorrenza portò ad un crescendo di annunzi. Nell’ottobre 1999 Venter annunziò il completamento di 1 miliardo di basi e lo stesso fu annunziato in novembre dal NIH; nel gennaio 2000 Venter annunziò di aver completato il 90% del genoma e a marzo Collins dichiarò il completamento di 2 miliardi di basi. Alla fine del 1999 si era parlato di collaborazione fra i due concorrenti, ma i dati erano rimasti separati nei rispettivi siti web. Alla fine del 2000 ambedue si accordarono di pubblicare simultaneamente, ma separatamente i risultati e nel febbraio 2001 il Consorzio pubblico presentò i suoi nella rivista Nature e la Celera nella rivista Science.

Science, 16 Feb 2001, Vol. 291, pg. 1219 - Svante Pääbo - Per il grande pubblico il completamento del genoma umano ha un enorme significato simbolico paragonabile allo sbarco sulla Luna ed all’esplosione della prima bomba atomica. Questi avvenimenti cambiano il nostro modo di avere coscienza di noi stessi e delle nostre prospettive: Lo sbarco sulla Luna ha allargato i nostri orizzonti nello spazio, la fissione dell’atomo ha messo a disposizione dell’uomo un potenziale di energia e di distruzione totale; il genoma ha rivelato il codice della vita degli esseri umani trasmessoci dai nostri antenati e questo ci lega a tutti gli altri esseri viventi. Il genoma apre la strada agli studi comparativi con altri organismi viventi dai più semplici ai più complessi. La scoperta che nell’uomo si trovano solo da 26000 a 38000 geni confrontati ai 13600 geni del moscerino della frutta, e molti sono comuni, ci ridimensiona e da un colpo all’idea della nostra unicità. Il confronto con le grandi scimmie antropomorfe fa intuire come pochi accidenti genetici abbiano reso possibile la straordinaria evoluzione dell’uomo fra 150000 e 50000 anni fa. Il fatto che le varianti genetiche che si trovano fuori dall’Africa sono solo una frazione minima di quelle africane ci conferma la nostra provenienza dal continente africano. La grande mobilità dell’uomo e la sua tendenza all’emigrazione fa sì che gente che vive in uno stesso continente presenti sequenze di DNA con più varianti di gruppi con provenienze diverse e questo può fare risalire alla storia delle migrazioni e toglie ogni valore ai pregiudizi razziali.

Science, 16 Feb 2001, Vol. 291, pg. 1255 - Jean-Michel Claverie - La conferma che il genoma umano contiene meno di 30000 geni che codificano proteine è uno dei primi risultati più importanti del progetto genoma. Un 30% in più di geni è sufficiente per passare dal semplice verme nematode (Caenorhabditis elegans) ai mammiferi ed agli umani e questo suscita provocatorie domande di ordine scientifico, filosofico, etico e religioso. Allo stesso modo un uomo ha 5 volte più geni di un batterio e questo rapporto rappresenta un paradosso se lo si correla direttamente alla nostra percezione di complessità biologica. Si tratta però di stabilire una relazione funzionale fra il rapporto dei geni N e la complessità biologica K; questa relazione può essere proporzionale, polinomiale, esponenziale o anche fattoriale. Quale è la relazione più ragionevole? Se la complessità di un genoma è in relazione al numero di stati che esso può produrre il modello più semplice è che ogni gene esprima o no uno stato e quindi N geni codificano 2^N stati quindi la complessità dell’uomo rispetto al nematode è K = 2^30000/2^20000 = 2^10000 =~ 10^3000 un numero più grande di tutte le particelle elementari dell’universo. Certo molti stati non sono indipendenti, o sono ridondanti o letali, e K si può ridurre di uno o due ordini di grandezza, ma anche così il risultato porta ad un rapporto di complessità enorme. Il sistema immunitario dei vertebrati mostra anche come la combinazione di risposta di poche centinaia di geni possa provocare un enorme repertorio di risposte specifiche. Questa funzione di complessità da anche un’idea su ciò che attende l’industria farmaceutica se vuole affrontare lo sviluppo di trattamenti personalizzati.

Science, 27 Jul 2001, Vol. 293, pg. 585 - Josh Gewolb - Un consorzio di ricercatori spera di iniziare presto la sequenza dell’intero genoma della banana (Musa), uno dei frutti più popolari nei paesi in via di sviluppo, e di completarlo entro il 2006. Il progetto durerà da 5 a 10 anni dipendenti dal grado di accuratezza desiderato con un costo di 7 milioni di US$ all’anno. Si stanno cercando ora i fondi e gli sponsor. Il tipo di banana da sequenziare sarà la Musa acuminata calcutta 4, una varietà selvatica e non commestibile scelta per la sua resistenza al fungo black sigatoka che riduce la resa delle piantagioni di banana fino al 50%. La banana sarà la terza pianta importante sequenziata dopo la Arabidopsis ed il riso ed avrà fra esse il genoma più grande con 500-600 milioni di coppie di basi.

Science, 5 Oct 2001, Vol. 294, pg. 82 - Elizabeth Pennisi - Pochi mesi dopo avere completato il genoma umano ci si è trovati ad affrontare un nuovo dilemma: cosa fare adesso. I grandi centri sorti per sequenziare i 3 miliardi di coppie di basi del genoma umano devono crearsi nuovi obiettivi. Determinare la funzione dei circa 45000 geni, oppure partire con il progetto Proteoma per identificare e caratterizzare le proteine prodotte dai geni, oppure sviluppare nuove tecnologie per accelerare le analisi. Con la sequenza del genoma in mano innumerevoli sono i problemi che aspettano una risposta. Tutti sono d’accordo che per prima cosa l’International HGP deve completare il lavoro e questo è previsto per il 2003. Nella lista delle priorità ci sono poi le sequenze di altri grandi genomi che possono aiutare a rivelare i segreti della storia evolutiva: quelli del topo, del ratto, dello zebrafish e del puffer fish sono già iniziati. Il topo verrà sequenziato in dettaglio entro il 2005. Cina ed Europa hanno cominciato a lavorare sul genoma del maiale, Giappone e Germania si stanno dedicando a quello dello scimpanzé. Gli alti costi costringono a dare delle priorità. Il numero totale di geni nell’uomo è ancora incerto, ma ormai si sa che ogni gene può specificare più proteine. Il National Human Genome Research Institute (NHGRI) ha anche in programma di studiare le variazioni genetiche dell’uomo, cioè di catalogare le differenze a livello delle singole coppie di basi o single-nucleotide polymorfism (SNP). Gruppi di queste variazioni tendono a trovarsi in blocchi del genoma ed i ricercatori vogliono metterli in relazione a difetti genetici. I progetti di grande respiro sono tre: funzionalità del genoma, progetto proteoma e bioinformatica. Il primo ha lo scopo di scoprire le funzioni dei geni e come agiscono, il secondo deve identificare funzioni e struttura delle proteine prodotte dai geni e le loro interazioni, la bioinformatica deve sviluppare la capacità dei ricercatori di manipolare, raccogliere ed analizzare i dati più rapidamente e con nuovi sistemi. Tutti questi progetti sono di costo elevato, ancora non ben valutabili e sono interconnessi. La tecnologia avrà un ruolo chiave nel futuro per accelerare le procedure ed abbassare i costi. Sono richiesti specialmente programmi di calcolo scientifico con metodi più efficienti per il trattamento dei dati. I genoma riempiono migliaia di CD-ROM ed il trasferimento di tale quantità di dati, l’interpretazione e l’analisi di essi da parte dei genetisti richiedono nuovi algoritmi specializzati.

Science, 22 Feb 2002, Vol. 295, pg. 1442 - Martin Enserink - The Institute for Genomic Research (TIGR) di Rockville, Maryland, ha deciso di sequenziare le 20 diverse varianti del Bacillus anthracis per poterli facilmente discriminare nelle indagini antiterrorismo e per sviluppare medicine e vaccini. Il TIGR ha già sequenziato due genomi ed ha documentato una bozza della variante detta Florida che ha fatto già una vittima lo scorso ottobre. Paragonando le varianti si potrà studiare perché alcune sono più virulenti di altre e perché alcune sopravvivono più a lungo al suolo.

Science, 22 Feb 2002, Vol. 295, pg. 1457 - Ben Shouse - Quando l’anno scorso fu completato il progetto del genoma umano, un’analisi computerizzata calcolò un numero di geni stranamente basso. Ora alla riunione annuale della AAAS del 15-19 febbraio un nuovo approccio sperimentale riporta il numero di geni ad un valore più vicino alla precedente previsione di 70000. L’identificazione delle sequenze genetiche basato su un software specializzato aveva dato come migliore previsione 32000 geni, successivamente all’università Hopkins di Baltimora, Maryland, si è fatta una ricerca sperimentale dei geni che il programma del computer aveva potuto perdere. I ricercatori hanno isolato con una nuova tecnica un codice di una ventina di coppie di basi unico per ogni singolo gene isolandolo da vari tessuti umani e lo hanno confrontato con quello dei geni riconosciuti nel nostro genoma. Il risultato è che solo circa la metà di questi codici coincidono con quelli dei geni identificati per l’uomo; questo è la prova che l’inventario dei geni è sottostimato di circa il 50%. La ragione di questa discrepanza può dipendere dal fatto che il programma standard usato per i geni era stato sviluppato per organismi semplici (procarioti) e non per le sequenze più complesse degli eucarioti per i quali non si è ancora ben attrezzati.

Science, 5 Apr 2002, Vol. 296, pg. 58 - Pamela Ronald and Hei Leung - Un detto cinese dice che le cose più preziose non sono la giada e le perle, ma i 5 cereali, il riso, il grano, il miglio, il sorgo ed il mais. Questi cereali rappresentano infatti il 60% delle calorie consumate dalle popolazioni del mondo in via di sviluppo. Specialmente il riso è stato recentemente l’obiettivo di una ricerca genetica che si è conclusa con la pubblicazione della sequenza delle due maggiori subspecie di riso, la indica e la japonica. Se la popolazione continua ad aumentare, nei prossimi 20 anni sarà necessario che la produzione di cereali aumenti dell’80% rispetto alla media del 1999. Le conoscenze derivate dalla ricerca genomica contribuiranno a migliorare la produzione. Tutti i cereali derivano dal gruppo delle piante monocotiledoni ed il primo genoma di questo gruppo che è stato sequenziato nel 2000 è quello della Arabidopsis thaliana. Un confronto con il genoma del riso ha mostrato che più dell’80% dei geni dell’Arabidopsis hanno i loro omologhi in quelli del riso, inoltre l’85% delle proteine di tutti i cereali sono simili a quelle del riso che quindi è una specie modello per una ricerca sui cereali. L’analisi comparativa dei geni riguarda anche la resistenza alle malattie, le loro funzioni e le proteine da essi generati. Una volta verificato tutto ciò si potranno sviluppare nuove varietà con l’introduzione di opportuni geni. Del riso si conoscono più di 100000 varietà e specie selvatiche e molte si conoscono da anni di selezione naturale o artificiale in condizioni climatiche diversa.

Science, 1 Nov 2002, Vol. 298, pg. 947 - Rebecca Spieler Trager - J. Craig Venter che ha lasciato in gennaio la sua posizione alla Celera Genomics di Rockville, Maryland, sta ora promuovendo la sua nuova fondazione non profit (la J. Craig Venter Science Foundation) cercando fondi per diversi progetti incluso quello di sviluppare organismi che producono idrogeno ed un laboratorio per sequenziare DNA ad alta velocità. Questo laboratorio, che spera sia pronto entro gennaio 2003, dovrà sequenziare il genoma di 1000 individui inclusi quelli degli sponsor. I genomi non saranno completi come quello prodotto dalla Celera nell’ambito dello Human Genome Project, ma saranno orientati alle aree dei geni essenziali. Questo nuovo database sarà molto utile perché dal confronto di molti singoli genomi si potranno identificare correlazioni fra geni e tratti somatici. Venter ha raccolto però molte critiche. I partecipanti e gli sponsor non devono sperare vantaggi perché i profili che ne possono derivare saranno deboli e poco affidabili ed i modelli al computer per identificare i geni non sono stati ancora validati. Venter è però confidente che una collezione di 1000 genomi umani potrà diventare un potente mezzo per identificare la cause delle malattie. Il laboratorio proverà anche altre tecnologie utilizzabili da altre compagnie incluso The Institute for Genomic Research (TIGR) di Rockville fondato dallo stesso Venter nel 1992 e guidato dalla moglie, la biologa Claire Fraser, che studia vecchi e nuovi organismi per metabolizzare carbonio e produrre idrogeno ed ha in parallelo 40 progetti per sequenziare genomi fra cui quello del Plasmodium vivax, altro parassita della malaria.

Science, 6 Dec 2002, Vol. 298, pg. 1863 - Elizabeth Pennisi - Il genoma del topo ad oggi è quello del secondo mammifero sequenziato. Questa settimana su Nature sono usciti 5 rapporti che fanno un raffronto con il genoma umano. Uomini e topi hanno circa 30000 geni ciascuno e l’80% si corrispondono, il genoma dell’uomo è più lungo, circa 3 miliardi di basi rispetto ai 2,5 miliardi di quello del topo. Il topo ha più geni destinati alla riproduzione, immunità e olfatto e le prime due categorie si sono evolute più rapidamente di quelle dell’uomo. In Italia è stata confrontata la sequenza dei geni del topo con quella del cromosoma umano 21, il più breve dei cromosomi e, analizzando quando e dove agisce ogni gene, si facilita la ricerca delle cause delle malattie. Altra ricerca importante è quella delle proteine prodotte dal genoma che è maggiore del numero dei geni. Nel frattempo, la scorsa settimana il Collegio di Medicina di Huston, nel Texas, ha annunziato che è stato completato un draft avanzato del genoma del ratto che permetterà di allargare l’indagine.

Science, 11 Apr 2003, Vol. 300, pg. 290 - Marvin E. Frazier - Negli ultimi tre anni il Department of Energy (DOE) USA ha chiamato università, laboratori nazionali ed industrie a collaborare ad un programma di ricerca chiamato Genome to Life (GTL). L’obiettivo centrale del programma è di comprendere i microbi e le comunità dei microbi e le loro funzioni a livello molecolare in modo da essere in grado di usarli in applicazioni pratiche. L’Ufficio delle Scienze del DOE vuole mettere insieme risorse biologiche, fisiche e di calcolo per affrontare la complessità del programma GTL. Già più di 70 microbi oggetto di studio del GTL sono stati sequenziati. Il primo obiettivo del GTL è di identificare e caratterizzare sistematicamente la macchina molecolare di microbi chiave e comprendere come le loro proteine lavorano all’interno della cellula. Il secondo obiettivo è di creare un modello del sistema di controllo di questa macchina molecolare. Il terzo obiettivo è di comprendere l’organizzazione e le capacità funzionali di una complessa comunità di microbi.. Forse la sfida maggiore che dovrà affrontare il programma GTL, come anche tutta la biologia, è quello di raccogliere, gestire ed analizzare il torrente di nuovi dati ed informazioni che arriveranno nelle prossime decadi e ciò richiederà la disponibilità di computer più capaci e connessi nelle reti dei laboratori di ricerca. Questo porta al quarto obiettivo che è di ingaggiare la vasta comunità di matematici ed esperti di computer per sviluppare un’infrastruttura adeguata.

Attraverso miliardi di anni di evoluzione i microbi hanno occupato tutti i possibili ambienti terrestri, dall’Artico agli ambienti vulcanici sottomarini; essi usano sostanze diverse come sorgenti di energia, anche alcune che consideriamo rifiuti tossici, e producono altre risorse di energia come biomasse, il metano e l’idrogeno. I microbi costituiscono il 50% della biomassa terrestre e persino una percentuale più alta degli esseri viventi ed hanno una funzione essenziale nel mantenere la biosfera controllando i cicli biogeochimici, agendo sulla produttività del suolo, sulla qualità dell’acqua e sul clima. Tutta la capacità del pianeta di sostenere la vita è completamente dipendente dall’attività microbica. Comprendere il mondo dei microbi è la chiave del nostro futuro riguardo ad energia, clima e tecnologie industriali avanzate ed in buona parte anche per comprendere come funziona la vita sulla Terra. Il successo del progetto Genoma Umano è stato basato sullo sviluppo di nuove tecnologie di sequenziazione del DNA; il GTL, oltre ad usare queste, dovrà isolare, identificare e caratterizzare proteine e complessi di proteine e reti di regolazione di sistemi viventi. Le tecnologie dei piccoli laboratori devono evolversi in tecnologie a livello industriale e nuove categorie di attrezzature sono da sviluppare. a) Attrezzature per la produzione e caratterizzazione delle proteine; nei prossimi 10 anni bisognerà produrre 250000 proteine in quantità dell’ordine di milligrammi. b) Attrezzature per l’analisi di un proteoma completo per comprendere il complesso delle proteine prodotte dai microbi in condizioni diverse. c) Attrezzature per la caratterizzazione e la rappresentazione delle macchine molecolari all’interno delle cellule viventi. d) Attrezzature per l’analisi e la modellizzazione dei sistemi cellulari per una predizione completa dei processi metabolici nei singoli microbi e nelle comunità dei microbi.

Nel giugno del 2001 il Presidente Bush parlando del problema del cambiamento climatico affermò la necessità di una soluzione basata sulla scienza e sulla possibilità di ridurre i gas serra usando tecnologie di cattura, immagazzinaggio e sequestro dell’anidride carbonica. Il problema fu poi enfatizzato dagli adviser scientifici nella preparazione del budget dell’anno fiscale 2004 dando delle priorità alla comprensione della vita a livello molecolare. In questa visione sono da affrontare tre problemi. a) Energie pulite mediante bioraffinerie che sfruttano microbi per trasformare la cellulosa delle piante in zuccheri elementari da fermentare in etanolo ed altri prodotti; anche l’idrogeno può essere prodotto da microrganismi su base biologica. b) Riduzione dei gas da effetto serra attraverso la conoscenza dell’attività microbica su questi gas attraverso il metabolismo delle piante. c) Neutralizzazione dei rifiuti tossici nell’ambiente inclusi radionucleidi e metalli; anche se essi non possono essere distrutti, i microbi possono inserirli in composti chimici insolubili che possano precipitare e divenire non tossici per l’ambiente.

Science, 29 Aug 2003, Vol. 301, pg. 1176 - Jennifer Couzin - In una recente riunione in Virginia sul sequenziamento dei geni i membri del National Human Genome Research Institute (NHGRI) hanno stimato che nei prossimi 4 anni verranno sequenziati 460 miliardi di coppie di basi equivalenti ai genomi di 22 mammiferi. I centri specializzati però si stanno coalizzando per preservare la loro influenza sulla scelta degli organismi da sequenziare e vogliono analizzare i dati genetici prodotti. I 30-40 maggiori ricercatori che partecipavano alla riunione hanno concordato che queste scelte devono essere guidate da esigenze di ricerca per rispondere a precise domande scientifiche, criteri che al momento non sembrano essere seguiti. Una lista delle richieste mette in ordine: a) genoma umano; b) organismi modelli; c) biologia dell’evoluzione; d) nuovi organismi. I problemi più recenti sono nella biologia delle popolazioni e nella genomica comparativa; analizzare i genomi di molte specie per vedere ciò che si è conservato nel tempo, cosa è stato aggiunto e cosa è stato abbandonato. Per la prossima riunione di settembre NHGRI vuole assicurarsi che le priorità siano in linea con il piano quinquennale definito lo scorso anno e fra gli obiettivi più ambiziosi si ricorda la definizione delle funzioni di ogni parte del genoma umano. Nel 2002 sono stati spesi 190 milioni di US$ e ci si aspetta che i costi di sequenziamento tenderanno a diminuire. La strategia della Celera Genomics di preferire il sequenziamento in bozza criticato da NHGRI sembra che ora venga preferita da tutti. La comunità del Drosophila confida di avere entro 10 anni le sequenze di 50 specie di questa mosca della frutta ma, se bisogna selezionare i genomi in base ai misteri biologici che possono svelare, bisogna fare una lista e si potrebbe decidere di preferire un vertebrato a 40 Drosophila.

Science, 12 Dec 2003, Vol. 302, pg. 1876 - Elizabeth Pennisi - Nonostante decenni di studi i genetisti non sanno ancora cosa rende umani gli uomini. Gli uomini ed i loro cugini, gli scimpanzé, hanno in comune quasi tutto il loro genoma. Gli studi del genoma suggeriscono che il funzionamento dei geni più che i geni stessi differenziano le due specie. Tuttavia alcuni genetisti hanno trovato delle differenze chiave nelle sequenze dei due genomi che hanno guidato l’evoluzione degli uomini e qualche volta hanno portato a malattie genetiche. I geni per l’olfatto e l’udito hanno subito rapidi cambiamenti durante l’evoluzione umana e sono diverse le basi genetiche delle malattie fra uomini e scimmie. Fra i 7600 geni comuni, i ricercatori hanno individuato quelli che hanno subito un numero di cambiamenti maggiore del normale; 107 dei 1000 geni coinvolti nello scambio di segnali fra le cellule e 11 sui 78 coinvolti nel metabolismo hanno subito cambiamenti importanti dal tempo quando scimpanzé e uomini hanno lasciato i comuni progenitori 5 milioni di anni fa, poi fra le due specie si sono avuti cambiamenti significativi e 27 delle 48 proteine olfattive e 3 delle 21 proteine dell’udito hanno subito nell’uomo dei cambiamenti accelerati accumulando mutazioni. L’evoluzione dei geni olfattivi è una stranezza perché gli uomini non basano molto la loro sopravvivenza sull’olfatto tuttavia queste mutazioni sono state selezionate nel corso dell’evoluzione e forse hanno promosso certi cambiamenti nella dieta o nella selezione sessuale. I ricercatori sono stati anche sorpresi dal fatto che molti dei nuovi geni causano malattie se vengono danneggiati.

Science, 29 Sep 2006, Vol. 313, pg. 1908 - Elizabeth Pennisi - Il gene HAR1F, che sta per “human accelerated region forward”, è attivo durante lo sviluppo del cervello al posto ed al tempo giusto ed ha stimolato l’espansione della corteccia cerebrale, centro della cognizione umana. Questo gene mostra segni di rapido cambiamento da quando umani e scimpanzé hanno separato la loro evoluzione indicando che esso ha conferito ai nostri antenati particolari vantaggi. HAR1F è solo uno dei 10 geni che sono emersi negli ultimi 4 anni come chiave potenziale dell’evoluzione del cervello umano. Avendo a disposizione il genoma di una dozzina di specie, inclusi gli umani, scimpanzé, rhesus, macachi, ed i potenti metodi bioinformatici per analizzare e paragonare questi DNA, è esplosa la ricerca su basi molecolari dell’evoluzione umana. Con nuove strategie, gli scienziati hanno scoperto centinaia di geni che hanno condizionato l’evoluzione umana ed alcuni dei più importanti riguardano l’evoluzione del cervello. Pochi hanno fatto ricerche nell’albero della vita per scoprire quando è iniziato a formarsi il sistema nervoso centrale con l’analisi di geni di organismi semplici, come quelli dei jellyfish, ma i maggiori progressi si sono avuti cercando i geni che hanno cambiato rapidamente, duplicando, fondendosi o esaltando il loro modo di esprimersi da quando la nostra specie si è distinta dagli scimpanzé. Questi geni sono i maggiori candidati per la formazione del moderno cervello umano. Fra un anno o due avremo una lista completa dei cambiamenti del genoma da analizzare. Si tratta solo di un inizio perché i dati del genoma sono più spesso un indizio che una risposta alle domande su ciò che ha provocato il salto degli umani dall’albero dei primati per camminare, parlare ed essere creativi e spesso si sa poco su quello che fanno questi geni. Filosofi e scienziati hanno a lungo cercato di capire ciò che rende gli umani unici nel regno animale. Fra le altre differenze le dimensioni del cervello sono tre volte quelle dello scimpanzé con una corteccia a più strati capace di calcolare e di scrivere. Si devono cercare i geni che la selezione naturale ha favorito negli umani e non nei nostri cugini scimpanzé e quelli che si sono evoluti più rapidamente rispetto agli altri. Un esempio è il gene detto FOXP2 la cui mutazione provoca disturbi nel linguaggio; 6 anni fa si è scoperto che la proteina codificata da questo gene differisce da quella dello scimpanzé in 2 dei 715 amminoacidi, un cambiamento rapido rispetto al tempo trascorso e questa alterazione ha aiutato gli umani a sviluppare il controllo motorio per pronunziare le parole. Esaminando 214 geni coinvolti nei disordini del cervello o attivi solo nel cervello, si sono contati i cambiamenti che non provocano differenze nella proteina codificata e quelli che alterano un amminoacido. Più numerosi sono questi ultimi cambiamenti più rapida è stata l’evoluzione. Due in particolare mostrano una rapida evoluzione: ASPM ed il Microcephalin dai quali deriva la microcefalite, un disordine genetico che porta ad una riduzione del cervello. All’Università di California è stato sviluppato un sofisticato programma al computer che confronta il genoma di specie diverse, umani, scimpanzé, roditori, cani e polli. Il programma ha scoperto 49 regioni nelle quali i genomi avevano le stesse sequenze, ma negli umani c’erano delle notevoli differenze avvenute negli ultimi 6 milioni di anni. HAR1F, per esempio è parte di una sequenza che ha subito 18 cambiamenti di basi su 118 e ci si sarebbe aspettato meno di un cambiamento in 6 milioni di anni. Questo gene è molto attivo nello sviluppo del cervello dell’embrione a 2 e5 mesi; il suo RNA esiste nelle cellule che organizzano la corteccia cerebrale in strati e si suppone che controlli la produzione delle proteine coinvolte nello sviluppo della corteccia. Il ruolo di HAR1F nel differenziare il cervello umano da quello degli scimpanzé sta nel dove, quando e come esso si esprime. L’azione di geni si esprime attraverso RNA messaggero (mRNA) ed i geni del cervello umano si sono evoluti in modo da esaltare la loro capacità di espressione. Nella corteccia cerebrale di umani, scimpanzé e macachi si sono trovati 91 geni che negli umani hanno accresciuto il loro livello di attività negli ultimi 6 milioni di anni. Una spiegazione potenziale per questo aumento di attività sta nel fatto che il genoma umano è ricco di copie extra di geni e sequenze DNA, 134 su 1005 hanno subito una duplicazione. Queste copie extra si suppone che abbiano alterato le modalità di espressione ed abbiano più modi per produrre proteine e RNA con i quali ha giocato l’evoluzione. Dei 134 geni duplicati, quello detto MGC8902 ha negli umani 49 copie, negli scimpanzé 10 e nei macachi 4. Nessuno sa esattamente cosa facciano tutti questi geni, ma si trovano particolarmente impegnati nella corteccia. Un altro genoma umano è il SIGLEC-11 che nella versione umana si è combinato con il SIGLEC-16 e forma una proteina specifica umana che agisce nella microglia, importante nella crescita delle cellule nervose. Queste ricerche mostrano tutte una tendenza cerebrocentrica dell’evoluzione, ma gli umani sono anche diversi per il loro sistema riproduttivo, muscolare- scheletrico e sistema immunitario come anche per la pelle. Un rapido cambiamento in un gene o la formazione di extracopie non significa che sono fondamentali nell’evoluzione e non tutte le mRNA producono proteine. Cercando prove di selezione nelle funzioni cerebrali, il gene ASPM e gli altri della microcefalia hanno dimostrato di avere effetti nella crescita del cervello degli embrioni dei topi. L’ASPM si concentra alle estremità delle cellule staminali neuroepiteliali durante la divisione cellulare e la formazione dei neuroni. Un altro gene è il PDYN (prodynorphin) importante nella percezione, dolore, comportamento sociale ed apprendimento e memoria; gli umani ne hanno 4 copie mentre le scimmie ne hanno una sola, ma nessuno sa esattamente quali effetti abbiano nel cervello umano. La situazione non cambierà in tempi brevi data la complessità dei problemi e l’impossibilità di riprodurre ciò che ha fatto l’evoluzione in molti milioni di anni.

Science, 10 Nov 2006, Vol. 314, pg. 908 - Elizabeth Pennisi - Recentemente è stato sequenziato il genoma del riccio di mare, Strongylocentrotus purpuratus (purple sea urchin), e la sua descrizione è uscita questa settimana su Science. Il genoma ha 814 milioni di basi DNA e 23500 geni che mostrano come questi invertebrati mangiatori di alghe hanno un sistema immunitario e sensoriale più complesso di quanto pensato. Il genoma include anche molti geni essenziali agli umani e ad altri vertebrati, mancano invece numerosi geni tipici di zanzare e vermi. Si constata concretamente che i ricci di mare ed altri echinodermi sono più vicini agli umani e ad altri cordati che agli scarafaggi, zanzare, granchi e molluschi. Nel decennio del 1870 dei ricercatori, studiando le uova del riccio di mare, hanno osservato per la prima volta la fusione di nuclei di ovuli e sperma; 25 anni dopo, nel 1902, Theodor Boveri ha usato i ricci di mare per dimostrare che era impossibile lo sviluppo della cellula embrionale se non possedeva il completo corredo dei cromosomi. Più di recente i ricercatori hanno cominciato a seguire le interazioni fra i geni seguendo lo sviluppo del riccio di mare. Ora per la prima volta la sequenza di un genoma è accompagnata da un’analisi completa di quando e dove entrano in azione i geni. Rapporti di studio aiutano a comprendere come gruppi di geni del riccio di mare abbiano funzioni specifiche, come la biomineralizzazione e nell’evoluzione del genoma stesso. I ricercatori hanno scoperto proprietà dei geni del sistema immunitario e come i geni sono impiegati per la riproduzione, lo sviluppo e la percezione del mondo esterno. Il riccio di mare infine ci fornisce una visione globale dei geni necessari all’evoluzione fino agli umani. L’embrione del riccio di mare ha 1500 cellule e solo una dozzina di tipi diversi ed è molto lontana dalla complessità di quello umano, tuttavia ha un gran numero di informazioni genetiche per essere un embrione semplice. I biochimici hanno usato un supercomputer della NASA per progettare un array che comprenda tutti i geni del riccio di mare ed il modello ha tracciato la successione dei geni che si attivano e disattivano nei primi 2 giorni dello sviluppo. Vengono coinvolti circa 11500 geni nella produzione di proteine ed il modello ha rivelato altre 51000 sequenze di RNA con funzioni non ancora identificate. I ricercatori hanno studiato a fondo l’intervento di 283 fattori di trascrizione, l’80% dei quali è intervenuto nello stesso intervallo di 2 giorni e si calcola che il 95% interverrà per la formazione completa della larva. Il riccio di mare ha circa 979 geni per le proteine la cui funzione è quella di avvertire la luce o gli odori, pari in numero a quelli dei vertebrati e più di quelli noti negli invertebrati. Tuttavia il riccio di mare manca di occhi, naso, antenne e di un cervello centralizzato per coordinare e reagire agli stimoli. Sono stati individuati 6 geni per le opsins, molecole fondamentali per percepire la luce e la loro presenza presumibilmente permette di percepire l’ambiente. Circa il sistema immunitario, si sa che gli invertebrati ne hanno solo uno innato, mentre i vertebrati hanno anche un sistema adattivo; il riccio di mare ne ha uno innato che è anche più complesso di quello corrispondente dei vertebrati. I ricci di mare possono produrre interleuchine e fattori di necrosi dei tumori, ma mancano di cellule immunitarie specializzate. In conclusione il genoma del riccio di mare dimostra che i vertebrati si sono evoluti elaborando ed adattando gruppi di geni sofisticati e preesistenti, alcuni dei quali hanno cambiato ruolo nel corso dell’evoluzione.

Science, 17 Nov 2006, Vol. 314, pg. 1068 - Elizabeth Pennisi - Le riviste Science e Nature hanno riportato in questa settimana i primi successi sulla sequenza del DNA tratto dalle ossa degli uomini di Neandertal. Due gruppi hanno lavorato in collaborazione, ma usando metodologie diverse ed i risultati confermano che i Neandertal sono un ramo della famiglia degli ominidi che si è separata dai suoi antenati forse 450000 anni fa o più. Essendo i nostri parenti più vicini, il DNA dei Neandertal potrebbe rivelare le mutazioni che hanno reso l’Homo sapiens diverso dalla altre specie: i tempi ed i cambiamenti essenziali; si potrebbero anche dare risposte al dibattito sulle differenze esistenti con gli uomini moderni e se i due gruppi si sono mescolati nel corso delle migliaia di anni in cui sono vissuti insieme. I due team hanno usato sistemi di sequenziamento più rapidi ed economici che dimostrano la capacità di decifrare materiali genetici antichi con nuove tecniche di estrazione e nuovi metodi di preparare i campioni. Uno dei team è guidato dal paleontologo Svanta Pääbo di Antropologia Evoluzionistica di Leipzig, in Germania, ed afferma di poter produrre un primo genoma dei Neandertal entro 2 anni, l’altro team è guidato da Edward Rubin del Genoma Institute di Walnut Creek, California, con il supporto del National Institute of Health (NIH) per raccogliere numerosi fossili dei Neandertal. La difficoltà sta nel trovare campioni utilizzabili ed evitare la contaminazione con materiale genetico moderno; le differenza dagli uomini moderni sono così piccole che è difficile essere poi confidenti sui risultati. Il primo tentativo di usare antico DNA è del 1984 quando si volle sequenziare DNA di un “quagga”, una specie estinta che somiglia ad un incrocio fra un cavallo ed una zebra. Un anno dopo Pääbo riuscì ad estrarre materiale genetico da una mummia egiziana di 2400 anni fa. Il DNA si degrada dopo la morte dell’organismo perché viene attaccato dall’acqua, dall’ossigeno e dai microbi. Il metodo della PCR (Polymerase Chain Reaction), che usa un enzima per ottenere milioni di copie di un frammento di DNA, è stato alla base di tutte le analisi su materiali genetici di specie estinte come i lupi della Tasmania ed i moas. Ci sono stati dei fallimenti come quelli del DNA di api di 25 milioni di anni fa conservate nell’ambra e quello di dinosauri che alla fine si scoprirono uguali a quello degli uomini attuali. Chiunque maneggia questi campioni lascia tracce del proprio DNA. Nel 1997 il team di Pääbo all’università di Monaco ha decodificato 379 coppie di basi del mitocondrial DNA (mtDNA) di un Neandertal e le ha trovate differenti da quelle degli uomini moderni, indizio che le due specie erano distinte; si sono separate circa mezzo milione di anni fa e non si sono mescolate fra di loro. Altri ricercatori pensano però le due specie si siano mescolate nel periodo della loro sovrapposizione. Dopo il 1997 Pääbo cominciò ad organizzare la raccolta dei campioni di ossa ed a stabilire la gerarchia delle prove. Il DNA nucleare nelle ossa è molto limitato ed è solo lo 0,05% di quello mtDNA. Fu provato un campione di 10 milligrammi con proteine intatte che indicavano una buona conservazione, quindi fu esaminato un campione di 150 milligrammi per confrontarlo con il DNA degli uomini moderni. Infine Pääbo ottenne un grande campione di osso antico di 38000 anni proveniente dalla Croazia da cui estrarre il DNA. Pääbo e Rubin lavorarono in collaborazione nella scelta dei metodi, ma con analisi indipendenti. Il team di Rubin creò una prima libreria del DNA dei Neandertal e furono estratte 65000 basi del DNA dei Neandertal. Il team di Pääbo identificò alla fine un milione di basi del Neandertal. Come ci si aspettava, i genomi dei Neandertal e degli umani moderni si sono dimostrati identici al 99,5%. Dalle analisi di Rubin risulta che le due specie umane hanno in comune con gli scimpanzé 502 mutazioni e gli umani moderni differiscono in 27 basi per l’evoluzione successiva. Assumendo che gli scimpanzé si siano separati dagli umani 6,5 milioni di anni fa, le due specie umane si sono separate probabilmente 700000 anni fa. Dalle analisi di Pääbo risulta che le due specie umane hanno in comune 10167 basi e 434 sono uniche negli umani moderni; da questa divergenza si calcola che le due specie si sono separate fra 465000 e 569000 anni fa. Il gruppo di Rubin non ha trovato tracce di incroci fra le due specie. In nessun caso si è trovato nei Neandertal un raro SNP (single nucleotide polymorphism) che si trova solo negli europei ma, date le dimensioni dei campioni di DNA, potrebbe esistere e sarà sempre difficile distinguere fra un basso livello di incrocio e nessun incrocio. Rimane sempre il problema della contaminazione. La maggiore fonte di contaminazione proviene dalla raccolta dei campioni sul campo e non nei laboratori. Anche gli archeologi usano ora precauzioni nella raccolta dei campioni e questo ha ridotto la contaminazione umana dal 95% al 5%. Più problematici sono gli errori dovuti al decadimento nel tempo per danni chimici. Ripetendo le prove su campioni diversi, dalla ripetitività si può acquisire maggiore confidenza. I risultati ottenuti sono incredibili se si pensa che fino a pochi anni fa erano ancora impossibili.

Science, 13 Apr 2007, Vol. 316, pg. 218 - Elizabeth Pennisi - La decifrazione del genoma umano è stata un’esperienza deludente: è mancata la promessa di scoprire ciò che ha prodotto l’uomo. Anche quando la maggior parte dei 3 miliardi di basi era stata posizionata, non si arrivati ad una comprensione. Fra i 20000 geni dell’Homo sapiens non si è scoperto dove si trovava quello che lo rendeva diverso dagli altri mammiferi o dagli altri primati. Per ricostruire la storia di ciascun gene sono necessari i dati dei nostri più prossimi parenti cioè il DNA delle diverse specie di primati per tracciare la loro evoluzione. Nel 2005 il genoma dello scimpanzè ha fatto sperare invano, ora il genoma del terzo primate, il macaco rheso, comincia a mettere gli altri due genoma in una prospettiva. I macachi sono scimmie del vecchio mondo che si sono divisi dalla stirpe delle scimmie 25 milioni di anni ed hanno poi prodotto sia gli scimpanzè che gli umani. Si possono così identificare le varianti genetiche primitive e, con gli altri sette genomi di primati che sono previsti, si potranno stabilire le regole dell’evoluzione dei primati. Un consorzio di più di 100 ricercatori sta trovando i geni che sono cambiati più rapidamente di quanto prevedibile negli scimpanzè e negli umani e questa rapidità ha generalmente un significato nell’evoluzione. Si stanno cercando anche dozzine di basi che con la loro modifica hanno portato rischi di malattie negli uomini e che si trovano anche nei macachi non a rischio, ma non negli scimpanzè. Questo suggerisce che alcune varianti genetiche implicate nella malattia sono relitti di condizioni ancestrali. Questi studi possono fare da ponte fra genomica comparativa e biologia evolutiva. Il genoma umano sequenziato nel 2001 ha fatto scoprire quanto poco sappiamo sul genoma stesso. Circa un terzo dei nostri geni sono sconosciuti. I ricercatori hanno subito confrontato il nostro genoma con quello dei vermi, dei pesci, dei rosicanti, per scoprire le identità e definirne le funzioni ed hanno trovato non solo i geni comuni ma anche le parti conservate del DNA, fra quello spazzatura (junk), che hanno un ruolo critico. Ogni specie aggiunta nella ricerca ha aumentato la nostra capacità di distinguere le parti funzionali da quelle non funzionali del DNA. La sorpresa del genoma dello scimpanzè è stata nel gran numero di basi aggiunte o assenti rispetto alla sequenza degli umani. Vi sono un numero maggiore di cambiamenti come numero di geni e blocchi di geni che singoli cambi di coppie di basi. I dati degli scimpanzè si sono rivelati frustranti perché i ricercatori non hanno potuto inserire il confronto scimpanzè-umani in un contesto di evoluzione. I ricercatori non avevano modo di scoprire quale delle varianti, quella dell’uomo o dello scimpanzè fosse la più antica. Per questo motivo nel 2005 il National Human Genome Research Institute ha inserito una serie di primati nell’elenco di quelli da sequenziare ed ha approvato 20 milioni di US$ per la sequenza del macaco rheso. Altri primati saranno l’orangutan ed il gibbone, le scimmie del nuovo mondo come il marmoset, già iniziato, ed il babbuino che sarà il prossimo. Nel 2006 in UK si è iniziato a decifrare il genoma del gorilla che avrà un’importanza simile a quella del macaco. Un confronto permetterà di stabilire ciò che è specifico degli umani. Già alcuni dati rivelano un poco della nostra storia genetica. Per esempio più del 98% delle basi umane e degli scimpanzè sono identiche e si potranno così individuare le aree con meno cambiamenti di quanto attesi nelle regioni di regolazione conservate in tutte le scimmie. Estendendo poi la ricerca a tutti i primati, si scoprono più variazioni di quanto prima rivelabili. Ad esempio, guardando 558000 basi dei geni coinvolti nell’elaborazione del colesterolo, paragonando gli umani ed altri sei primati, si sono scoperte regioni che hanno le stesse sequenze in tutti i primati. In altri casi, studiando le differenze, si mette in evidenza un’evoluzione indipendente. Si era pensato che le 64000 basi del genoma del macaco con mutazioni relazionati a malattie, fossero specifiche degli umani, mentre negli altri primati possono essere o no presenti. Molte varianti di malattie possono avere cause ambientali o di dieta. Macachi, scimpanzè ed umani si distinguono per famiglie di geni che si sono evolute in modo leggermente differente. Una in particolare è la famiglia detta PRAME (preferentially expressed antigen of melanoma), i cui geni sono attivati nel melanoma ed in altri tipi di tumore, che ha avuto una storia complessa negli umani perché comprende negli umani 26 geni. Gli scimpanzè hanno un complesso PRAME simile, nel macaco vi si trovano solo 8 geni, ma possiede anche 33 altri complessi, più di tre volte che negli umani. Con un numero sufficiente di genomi di primati si potranno individuare con maggiore confidenza i geni specifici degli umani non presenti negli altri primati, ma anche comprendere l’intera storia dell’evoluzione dei primati.

Science, 25 May 2007, Vol. 316, pg. 1113 - Elizabeh Pennisi - Sette anni fa alla domanda di quanti geni avesse il genoma umano, la previsione fu fra 28000 e 150000 e che la risposta sarebbe venuta entro il 2003. Ancora oggi la situazione rimane confusa. I tre database che tracciano la situazione dei geni che codificano le proteine non concordano e forniscono totali di 23000, 19000 e 18000. L’ultima risposta è di 20488 con forse altri 100 da scoprire. Nel significato classico un gene è una sequenza di DNA che codifica una particolare proteina. Per produrre una proteina, il gene deve essere prima trascritto, un processo in cui la cellula genera una molecola di RNA che porta le istruzioni del gene al centro di produzione delle proteine. Il programma di predizione dei geni si basa sull’identificazione di una trama di lettura fra i codici a tre basi che stabiliscono l’inizio e la fine della trascrizione. Tuttavia c’è stata un’esplosione di scoperte su geni RNA con sequenze di trascrizione che hanno funzioni biologiche, ma che non producono proteine e recentemente si sono trovati migliaia di altri geni che non producono proteine, ma i ricercatori non sanno che cosa facciano. Di conseguenza una trama di lettura non è abbastanza per identificare un gene. Sono stati comparati tutti i geni umani in un database detto Ensembl con quelli catalogati per i cani ed i topi. Complessivamente 19209 erano geni codificanti proteine secondo McCoy, 3009 erano stati introdotti per errore nella lista e 1177 rimanevano ambigui. Per ottenere un dato definitivo e conciliare le differenze fra tutti gli enti ufficiali del conteggio, il lavoro sembra lungo e duro, ma chi non concorda deve dimostrare che è sbagliato.