Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
AstronomieBiofizicaBiologieBotanicaCartiChimieCopii
Educatie civicaFabule ghicitoriFizicaGramaticaJocLiteratura romanaLogica
MatematicaPoeziiPsihologie psihiatrieSociologie


ORGANIZAREA MOLECULARA, EXPRESIA SI REGLAREA GENELOR EUCARIOTE

Biologie



+ Font mai mare | - Font mai mic



ORGANIZAREA MOLECULARA, EXPRESIA SI REGLAREA GENELOR EUCARIOTE

Genomul eucariotelor: unitati de transcriptie simple si complexe

Cea mai mare parte a genelor care codifica pentru polipeptide poseda cel putin un intron, un numar mare de gene avand mai multi (tabel 2). Totusi, prezenta intronilor nu este obligatorie existand si gene lipsite. Genele care codifica pentru moleculele de ARN functionale cum sunt ARNt si ARNr pot sa posede si ele secvente intercalare , dar intreruperile la nivelul acestor gene sunt mai putin frecvente. In general, cantitatea de ADN prezenta in introni depaseste cu mult pe cea din exoni. Existenta intronilor si enorma diversitate a numarului si a marimii lor explica numarul mare de molecule de ARN nuclear la eucariote si totodata eterogenitatea foarte pronuntata si lungimea lor considerabila. Moleculele de ARN nuclear eterogen (ARNh) reprezinta o colectie de transcrpti pentru numeroase gene nucleare. Unii dintre acestia sunt transcripti primari, marimea lor fiind identica cu cea a genei, iar altii sunt molecule partial maturate care sunt lipsite de un numar variabil de introni. Este foarte interesant ca moleculele de ARNm citoplasmatic sunt produsul unei astfel de colectii complexe de precursori.



Figura:

ARN transcris de la nivelul unei unitati complexe (albastru) poate fi procesat pe mai multe cai pentru a conduce la unul sau la mai multe unitati ARNm monocistronice functionale. Liniile punctate marcheza inlaturarea intronilor.

a)      O unitate de transcriptie al carui transcript primar poseda doua situsuri poli(A) poate da nastere la doua molecule de ARNm diferite prin folosirea alternativa a exonilor sitiuati in 3'.

b) O unitate transcriptionala complexa al carei transcript primar sufera inlaturarea exonilor in timpul procesarii produce molecule alternativede ARNm care au aceeasi exoni in 5' si in 3'. In acest exemplu, unele tipuri celulare exprima ARNm care contine exonul 3 in timp ce altele exonul 2 este alipit exonului 4 in acre lipseste exonul 3. Mutatiile produse in (a) si (b) afecteaza proteinele ambelor forme alternative de ARNm. In contrast, mutatiile (desemnate prin c si d) prezente in interiorul exonului unic al uneia dintre formele alternative de ARNm afecteaza numai proteina codificata de catre acest ARNm.

Reglarea expresiei genelor procariote

Analizele de structura si functie ale genelor eucariote au evidentiat ca genele procariote si eucariote sufera puternic din punct de vedere al complexitatii secventelor scurte (motive) responsabile de reglarea transcriptiei (figura 3). Au fost evidentiate trei tipuri de motive in genele procariote. un prim tip include secventele care determina debutul transcriptiei: in E. coli, promotorii sunt definiti prin doua regiuni de ADN prezente la 10 si 35 perechi de baze in amont fata de situsul de initiere a transcriptiei. Un al doilea tip de element marcheaza terminarea genei sau a unui grup de gene si favorizeaza terminarea transcriptiei. In sfarsit, exista secvente de ADN adiacente sau incalecate in raport cu promotorii, care sunt recunoscute de efectori specifici cum sunt represorii, activatorii si terminatorii, care moduleaza transcriptia. Toate aceste secvente de reglare specifica depind de interactiunile care le realizeaza cu proteinele specifice care au rolul de a influenta expresia secventelor codante vecine.

Reglarea expresiei genelor eucariote

Studii de genetica moleculara si de biochimie au evidentiat temele care guverneaza reglarea transcriptiei si care furnizeaza bazele de intelegere a expresiei diferentiate a genelor. Astfel, secventele reglatoare sunt formate dintr-o suita complexa de motive de ADN relativ scurte. Fiecare motiv este situsul de fixare al unei proteine specifice, un factor de transcriptie. De exemplu, genele care nu sunt transcrise decat in celulele limfoide contin o serie de motive care sunt recunoscute de factori de transcriptie specifici acestor celule. La fel, genele care nu sunt transcrise decat in anumite momente si in conditii particulare contin motive de reglare care interactioneaza cu proteine specifice care nu sunt prezente sau active decat in aceste momente sau in aceste circumstante. In consecinta, reglarea transcriptiei fiecarei gene reflecta cooperarea particulare (asortarea) si aranjamentul acestor motive, prezenta factorilor de transcriptie adecvati si de modul in care acesti factori influenteaza initierea transcriptiei. Fixarea mai multor factori de transcriptie in regiunea de reglare faciliteaza fie asamblarea ARN polimerazei intr-un complex de transcriptie, fie activarea acestui complex, fie ambele procese.

Reglarea expresiei genelor eucariote

Analizele de structura si functie ale genelor eucariote au evidentiat ca genele procariote si eucariote sufera puternic din punct de vedere al complexitatii secventelor scurte (motive) responsabile de reglarea transcriptiei (figura 3). Au fost evidentiate trei tipuri de motive in genele procariote. un prim tip include secventele care determina debutul transcriptiei: in E. coli, promotorii sunt definiti prin doua regiuni de ADN prezente la 10 si 35 perechi de baze in amont fata de situsul de initiere a transcriptiei. Un al doilea tip de element marcheaza terminarea genei sau a unui grup de gene si favorizeaza terminarea transcriptiei. In sfarsit, exista secvente de ADN adiacente sau incalecate in raport cu promotorii, care sunt recunoscute de efectori specifici cum sunt represorii, activatorii si terminatorii, care moduleaza transcriptia. Toate aceste secvente de reglare specifica depind de interactiunile care le realizeaza cu proteinele specifice care au rolul de a influenta expresia secventelor codante vecine.

Secventele de ADN care regleaza expresia genelor eucariote au localizari variabile, sunt situate la distante variabile si au orientari diverse in raport cu situsul de demarare si de oprire a transcriptiei. In plus, trei polimeraze diferite, I, II si III, transcriu trei clase de gene distincte fiecare asociata cu semnale specifice de control a transcriptiei si terminarii acesteia. Studii de genetica moleculara si de biochimie au evidentiat temele care guverneaza reglarea transcriptiei si care furnizeaza bazele de intelegere a expresiei diferentiate a genelor. Astfel, secventele reglatoare sunt formate dintr-o suita complexa de motive de ADN relativ scurte. Fiecare motiv este situsul de fixare al unei proteine specifice, un factor de transcriptie. De exemplu, genele care nu sunt transcrise decat in celulele limfoide contin o serie de motive care sunt recunoscute de factori de transcriptie specifici acestor celule. La fel, genele care nu sunt transcrise decat in anumite momente si in conditii particulare contin motive de reglare care interactioneaza cu proteine specifice care nu sunt prezente sau active decat in aceste momente sau in aceste circumstante. In consecinta, reglarea transcriptiei fiecarei gene reflecta cooperarea particulare (asortarea) si aranjamentul acestor motive, prezenta factorilor de transcriptie adecvati si de modul in care acesti factori influenteaza initierea transcriptiei. Fixarea mai multor factori de transcriptie in regiunea de reglare faciliteaza fie asamblarea ARN polimerazei intr-un complex de transcriptie, fie activarea acestui complex, fie ambele procese.

O caracteristica extraordinara a acestor mecanisme o reprezinta universalitatea lor. Este remarcabil faptul ca aceste mecanisme cu origini foarte diverse (cum este cazul drojdiei, Drosofilei sau celulelor de mamifere) sa fie interschimbabile. Astfel, un factor de la drojdii sau de la Drosophila poate interactiona cu motive nucleotidice de la mamifere si cu celelalte proteine ale complexului de transcriptie la fel de bine ca si factorii de transcriptie de la mamifere. Situatie inversa este adesea adevarata. Aceasta implica o conservare certa a acestor structuri in cursul evolutiei.

Mecanismul de terminare a transcriptiei este diferit pentru cele trei ADN polimeraze: fiecare depinde de motivele de secventa situate la, sau aproape de extremitatea unitatii de transcriptie. La acest nivel, motivele interactioneaza cu proteine adecvate, factorii de terminare. Reglarea terminarii este consecinta aranjamentului motivelor ADN si formarea unui ansamblu multiproteic care faciliteaza terminarea si modificarea extremitatii ARN.

Expresia anumitor gene este afectata de schimbari epigenetice care altereaza capacitatea unei gene de a se exprima (de a fi exprimata) fara a fi afectata secventa sa nucleotidica. O forma de modificare epigenetica identificata este asociata cu gradul de metilare a citozinelor la nivelul secventelor 5'-CG care flancheaza regiunea 5' a unei gene. O crestere a metilarii in aceasta regiune este corelata cu o reducere sau chiar cu o absenta a expresiei unei gene vecine, in timp ce o reducere a metilarii se traduce printr-o expresie crescuta. Modificarile de structura a cromatinei (in structura sa intrinseca), cu toate ca nu sunt inca bine caracterizate pentru moment, pot influenta, de asemenea, nivelul expresiei genelor apropiate, un nivel ridicat de expresie neexistand decat in regiuni decondensate ale cromatinei.

Comparatie intre operonul lac (a) si gena ovalbuminei

FIGURA:

a) harta genetica a operonului lac de la E. Coli, care reprezinta genele care mediaza metabolismul lactozei si situsurile genetice care controleaza expresia acestora. Genele Z, Y si A codifica pentru beta-galactozidaza, galactozid permeaza, tiogalactozid transacetilaza.

I = regiunea genelor reglatoare; P = regiunea promotoare si O = regiunea operatoare

b) Secventa etapelor de producere a ARNm matur in cazul genei ovalbuminei de pui. Dupa transcriere, transcriptului primar i se adauga structura "coif" si coada poli(A). In continuare sunt excizati intronii pentru a forma molecula matura de ARNm.

Caracteristicile neasteptate ale genelor eucariote au favorizat discutiile privind subiectul definitiei unei gene ca unitate de informatie ereditara. Mai multe definitii sunt posibile dar nici una dintre ele nu este total satisfacatoare sau adecvata tuturor genelor. In optica acestui curs am adoptat o definitie moleculara (figura 4). O gena eucariota este o combinatie de segmente de ADN care, impreuna, formeaza o unitate de expresie, aceasta conducand la formarea unuia sau mai multor produsi specifici, ARN, polipeptide. Segmentele unei gene contin: 1) regiunea transcrisa (unitatea de transcriptie) care contine secventele codante , secventele intercalare, secventele din regiunea 5' leader si 3' trailer netraduse, care flancheaza aceste secvente codante si segmentele reglatoare incluse in unitatea de transcriptie astfel ca (2) secventele reglatoare care flancheaza unitatea de transcriptie sunt necesare expresiei sale specifice.

La procariote, initierea si oprirea transcriptiei par sa fie primul nivel de control al expresiei genelor, chiar daca in anumite cazuri pot sa intervina alte mecanisme: atenuarea terminarea, anti-terminarea, controlul traducerii sau reglarea proportiei de reinnoire a ARN si a proteinelor. De altfel, aceste mecanisme de initiere (pornire) si de oprire a transcriptiei sunt elemente critice pentru reglarea expresiei genelor eucariote. Maturarea si particular schema de maturare (excizie-epissage), influenteaza natura mesagerilor formati si in consecinta natura proteinelor produse. Exista, de asemenea, argumente foarte bune in favoarea reglarii prin atenuare sau terminare a transcriptiei si exista si indicatii ca traducerea si reinnoirea ARN intervin de asemenea in reglarea producerii de proteine. In plus, caracteristicile unice ale celulelor eucariote si structura genelor lor furnizeaza posibilitati particulare de control al fluxului de informatie genetica. De exemplu, transcriptul unei gene nu este functional atata timp cat intronii nu au fost eliminati convenabil. De altfel, chiar si transcriptii destinati sa devina ARNm trebuie sa fie modificati la extremitatea lor 5' si 3': numai astfel moleculele de ARNm pot traversa membrana nucleara catre citoplasma inainte de a fi tradusi. Fiecare dintre aceste evenimente poate constitui un punct de control.

Genoamele eucariotelor superioare contin mult ADN "ne-functional"

Fiogura:

Diagramele regiunii de aprox 80 kb de pe cromozomul III al S. Cerevisiae si a clusterului genei globinei umane situat pe cromozomul 11.

a)      La cromozomul de drojdie, ADN (casutele albastre) indica fazele deschise de lectura; nu este clar daca toate aceste secvente care codifica potential pentru prtoteine sunt gene functionale.

b) In ADN uman, dreptunghiurile albastre reprezinta regiuni transcrise care codifica proteinele tip globina indicate. Fiecare gena tip globina are un aranjament similar de exoni si introni (care nu sunt evidentiati). Clusterul genei Beta-globinei umana contine doua pseudogene (marcate cu diagonale); aceste regiuni sunt inrudite cu genele functionale ale globinelor dar nu sunt transcrise. Sagetile rosii indica localizarea secventelor Alu (secvente repetitive de aproximativ 300 pb care sunt relativ abundente in genomul uman). De retinut proprtia mare a secventelor necodante in raport cu cele codante in structura genomului uman fata de cel al dojdiilor.

Structura genomului eucariotelor

Cu toate ca genele procariote difera puternic de genele procariote, prin structura lor, organizarea informatiei genetice este foarte diferita in cele doua grupe de organisme. In genomul bacterian, genele sunt continue (contigue) dea lungul ADN, adesea chiar secventele lor se incaleca. Genele care codifica pentru enzime care participa la aceeasi cale metabolica , ale caror activitati sunt apropiate, sunt frecvent asociate intr-o singura unitate de transcriptie. Acest aranjament permite o utilizare foarte eficace a secventei ADN. Economia pare sa fie mult mai putin importanta in cursul evolutiei eucariotelor. In ciuda enormei cantitati de ADN prezenta in introni, genele eucariotelor sunt separate si de secvente necodante foarte lungi. Cum s-a mentionat mai inainte, sunt rare genele multiple intr-o singura unitate de transcriptie.

Repartitia ADN in mai multi cromozomi este un punct fundamental in organizarea genomului eucariotelor. Cromozomii celulari contin probabil intotdeauna ADN bicatenar linear chiar daca de formeaza bucle de ADN duplex care da nastere unor domenii circulare situate de-a lungul scheletului linear. In timpul interfazei fiecare cromozom contine o singura dubla elice ADN, ca cele doua cromatide surori ale unui cromozom in metafaza. Genoamele a numeroase virusuri ale eucariotelor, ca si cromozomii cloroplastelor si marea majoritate a mitocondriilor, sunt unitati de ADN circular.

Exista tipuri de ADN eucariot care nu sunt niciodata transcrise

Abundenta secventelor necodante in genoamele organismelor superioare este ilustrata in figura anterioara.

Clusterul genelor beta-globinei este neobisnuit de bogat in secvente codante pentru proteine in comparatie cu alte secvente de la vertebrate.

De ex: in regiunea de 50 kb care contine gena de pui pentru lizozim, totalul exonilor este de mai putin de 500 pb.

Deoarece pentru majoritatea ADN ne-codant nu au fost inca identificate functii, este foarte usor sa il consideram ca nefunctional.

Nu exista un principiu determinant al distributiei genelor de-a lungul cromozomilor. Acest lucru a fost sugerat in timpul cartografiei genelor de la Drosophila melanogaster prin tehnici genetice si citogenetice. Totusi, aceste harti nu tin cont decat de o cantitate scazuta din ADN total, hartile genetice ale genoamelor de mamifere fiind inca destul de incomplete. In 1973, erau localizate numai 60 de gene umane la nivelul autozomilor si in 1981 un numar de 400. In ultimul timp, gratie clonarii segmentelor de ADN, acest numar a crescut la peste 1000 in 1992 si la secvedntierea genomului uman in anul 2000. Totusi, cartile genetice cele mai complete nu furnizeaza si nu evidentiaza o localizare sistematica a genelor. Gene inrudite sau gene prezente in mai multe copii pot fi grupate sau dispersate pe mai multi cromozomi. Astfel, genele care codifica pentru actinele cardiace si scheletice se gasesc, respectiv pe cromozomii 15 si 1. De altfel, cu toate ca genele care codifica pentru cinci tipuri diferite de polipeptide de b-globine umane sunt grupate pe cromozomul 11, cele care specifica polipeptidele a-globinelor sunt grupate pe cromozomul 16, cu toate ca aceste gene sunt inrudite si ca cele doua tipuri de polipeptide sunt necesare la formarea hemoglobinei.

Genele clonate sunt adesea obtinute impreuna cu fragmente lungi de ADN care le flancheaza. Un segment care se incaleca poate fi clonat plecand de la o banca genomica si un segment de ADN unic prezent la nivelul ADN flancant este sub-clonat si folosit drept sonda. Prin repetarea acestei operatii se pot obtine harti detaliate pentru regiuni cromozomice lungi. Aceste harti contin informatii structurale si functionale. De exemplu: cele 65 kpb care contin cele cinci gene ale b-globinei umane au fost clonate in segmente incalecate si secventa nucleotidica este cunoscuta in intregime, permitand localizarea regiunilor codante, a regiunilor de reglare si a intronilor.

Hartile se restrictie ale unei regiuni cromozomice sunt foarte utile pentru detectarea variatiilor de secventa de la o alela la alta, mai ales in cazul alelelor modificate (alterate). Astfel, folosind ca sonda de hibridizare un segment de b-globina umana clonat specific, putem examina la numerosi indivizi, regiunea ADN care codifica pentru b-globina, doar efectuand o digestie cu endonucleaze de restrictie si un transfer de ADN (Southern blotting) (Figura 6). O modificare a marimii segmentului care se hibridizeaza cu sonda indica fie o alterare a unui situs de restrictie m fie o deletie sau o insertie intre doua situsuri de restrictie. Absenta hibridizarii cu o anumita sonda indica deletia (lipsa) intregii regiuni studiate. Astfel de modificari sau polimorfism de restrictie, RFLP (Restriction Fragment Lengh Polymorfism), chiar daca sunt lipsite de consecinte fenotipice, furnizeaza markeri genetici, la fel de utili ca si markerii clasici, pentru analiza genetica a unor familii mari in populatia umana. Aceasta tehnica a fost utilizata pentru studierea transmiterii hemoglobinopatiilor si altor maladii genetice. In plus, o serie de fragmente polimorfe obtinute cu ajutorul endonucleazelor de restrictie pornind de la diferite portiuni de cromozom pot fi utilizate ca markeri pentru o analiza de legatura genetica, facand posibila constructia unei harti genetice chiar si in absenta markerilor fenotipici. Acest tip de analiza a fost utilizat pentru ordonarea mai multor gene pe bratul scurt al cromozomului 11 uman: centromer * catalaza hormon paratiroidian - e-globina - b-globina - insulina - pepsinogen.

Una dintre surprizele care au derivat din aceste analize este marea frecventa a diferentelor de secvente nucleotidice intre indivizi. Prin definitie, analizele mutatiilor realizate prin genetica clasica utilizeaza modificarile genomice cu evidente consecinte fenotipice. Era normal sa consideram ca genoamele indivizilor normali (salbateci) sa prezinte putine diferente. aceste mod de abordare simplist a fost adesea accentuat prin accentul pus pe existenta alelelor dominante si recesive, considerandu-se ca nu pot exista decat doua sau cel mult un numar redus de alele pentru un anumit tip de gena. Totusi, polimorfismul lungimii fragmentelor de restrictie este foarte frecvent atat la nivelul regiunilor codante cat ti necodante, demonstrand marea diversitate a genoamelor indivizilor unei specii, fara consecinte fenotipice identificabile. Unele dintre aceste polimorfisme pot avea efecte subtile, dar marea majoritate a acestora se releva a nu avea consecinte detectabile.

Experimentele de reasociere evidentiaza trei fractii majore pentru ADN eucariot

In concluzie: cantitatea totala de ADN de la diferite animale si plante nu variaza concordant cu complexitatea organismelor. De asemenea cantitatea de ADN poate varia si intre specii inrudite. SECVENTE REPETITIVE IN GENOM

ADN repetitiv este definit prin rata sa rapida de renaturare. Tpic acesta consta in secvente scurte care sunt repetitive in copii identice sau inrudite in genom. Componenta care se renatureaza cel mai rapid in genomul eucariotelor este reprezentata de secventele 'inalt repetitive', si consta in secvente foarte scurte care se repeta de multe ori in tandem sub forma unor clustere mari. Datorita acestor unitati repetitive scurte, aceste secvente de ADN sunt adesea denumite 'secvente simple de ADN'. Acest tip de secvente ADN sunt prezente in aproape toate genoamele eucariote, dar cantitatea lor totala este extrem de variabila. In genoamele mamiferelor acestea reprezinta, in mod normal, < 10%m dar (de exemplu) la Drosophila virilis, cantitatea este de 50%. Pe langa clusterele mari in care au fost descoperite initial aceste secvente, exista clustere mao mici separate de secvente de ADN nerepetitive.

Repetitiile in tandem ale secventelor scurte creaza adesea adesea o fractiune distincta cu proprietati fizice care permit izolarea sa. In unele cazurim secventa repetitiva poseda o compozitie in baze distincta fata de compozotia normala a genomului care ii permite formarea unei fractii separate si distincte datorita densitatii sale. O fractie de acest tip este numita 'ADN satelit'. Termenul 'satelit' este sinonimul esential pentru 'secvente simple ADN'.

Secventele repetitive in tandem sunt special corelate cu modificarea alinierilor care apar in urma imperecherii cromozomilor, si astfel marimea clusterelor in tandem tinde sa fie foarte polimorfa, cu variatii largi intre indivizi. De fapt, cele mai mici clustere de astfel de secvente pot fi folosite pentru a caracteriza genoame individuale folosind tehnica 'fingerprinting'.

Comparatii ale regiunilor corespunzatoare secventelor simple de ADN din interiorul speciilor ne ofera informatii despre mecanismele implicate in manipularea secventelor ADN din perioade evolutive diferite. Pentru moment nu putem spune cu precizie daca aceste secvente au o functie structurala.

Variabilitatea in cadrul unei familii de secvente repetitive

Asa cum am discutat mai devreme secventele nucleotidice ale membrilor unei anumite familii de gene pot fi identice sau pot varia prin una sau mai multe perechi de baze. In ultimul caz se considera ca familia este polimorfa. Dupa cum am constatat in unekle cazuri divergenta poate fi considerabila. Termeni de sub-familii si super-familii sunt adesea desemnati sunt folositi pentru a numi grupuri de membri ai unei familii care prezinta o similitudine mai mare sau mai mica. Divergenta dintre membrii unei familii poate fi estimata prin patru metode a caror sensibilitate este din ce in ce mai mare: a) compararea hartilor de restrictie; b) compararea capacitatii de a forma hibrizi; c) masurarea termostabilitatii hibriziolor duplex formati intre membrii familiei; C) compararea secventelor lor nucleotidice. Conditii stricte de hibridizare ( de obicei o temperatura ridicata de 650C, si p concentatie salina destul de slaba, in jur de 0,45 M NaCl) nu permite in general formarea unui duplex intre segmentele de ADN care poseda mai putin de 85% complementaritate Prin reducerea temperaturii si cresterea conc saline (reducerea sensibilitatii testului), este posibila hibridarea unor segmente mai putin inrudite, dar limita inferioara de detectare se situiaza in jur de 70% complementaritate. Stabilitatea heteroduplexului format este estimata masurand transformarea in monocatene in functie de temperatura. Regula reste ca temperatura de fuziune Tm (melting) sa fie diminuata cu 10C pentru 100 de baze ne-imperechiate.

Segmentele de ADN bicatenar se numesc onologe daca secventele lor sunt identice. Totusi, termenul de omolog este adesea folosit pentru a descrie segmentele de ADN similare dar nu si identice. Frecvent, un calificativ este folosit pentru a indica gradul de identitate. Daca secventele sunt cunoscute, este posibila realizarea de comparatii cantitative. Astfel, daca doua segmente de ADN sunt descrise ca reprezentand 70% omologie (sau 70% similitudine) inseamna ca 70% din bazele lor (resturi de nucleotide) sunt identice si colineare. Aceasta modalitate de exprimare decurge din conceptul de cromozom omolog, dar se distanteaza de cel folosit clasic in literatura asupra evolutiei biologice. Aici, omolog semnifica, in general, ca structuri morfologice sau de secventa ADN provin dintr-un stramos comun, si in acest caz termenul de procentaj de omologie este lipsit de sens.Deci, folosirea frecventa a termenului de procentaj de omologie este un pic ambigua in lucrarile de genetica moleculara. Termenul de procentaj de similitudine evita mai bine ambiguitatea cu toate ca este rar intalnit in litaratura.

Secvente consens   

Atunci cand o familie de secvente repetitive poseda numerosi membri, unde fiecare nu difera de ceilati decat prin cateva pozitii in secventa nucleotidica, este adesea comod sa definim un fel de secventa medie sau consens sau canonica pentru membrii familiei. O secventa consens contine baza cel mai frecvent intalnita la fiecare pozitie in ansamblul membrilor familiei si nu este neaparat identica cu secventa oricaruia dintre membri. Exista doua modiri de a obtine o secventa consens. Adesea este posibila izolarea unei populatii mari de unitati repetitive, lipsite de secvente ne-imperechiate si apoi realizarea unei analize de secventa a amestecului. Chiar daca fiecare molecula din populatie difera de celelalte in cateva pozitii, se obtine adesea o secventa nucleotidica unica deoarece metodele de secventializare nu detecteaza concentratiile mici de nucleotide pentru fiecare pozitie. Intr-un alt tip de abordare se realizeaza compararea unui anumit numar de secvente ai membrilor unei familii care au fost clonate individual, iar baza cea mai frecventa din fiecare pozitie este determinata folosind un anumit soft pe calculator.

Este util sa amintim ca definitia unei familii de secvente repetitive este pragmatica. In absenta datelor despre secventa reala, o familie este in general considerata ca un ansamblu de secvente care se hibridizeaza intre ele, sau cu un membru clonat din familie, aceasta in conditii stricte. In general, aceasta semnifica ca secventele care prezinta diferente de 15-20% de o secventa consens sunt abia decelabile, si ca secvente mai divergente nu pot fi considerate membri ai familiei. Prntre altele, identificarea prin hubridizare a familiilor de secvente repetitive exclude sistematic toate familiile ale caror membri sunt prea scurti pentru a se reasocia. Astfel, membrri familiei de secvente 5' ACT(A sau T)nTA care preced genele ARNt nu pot fi adesea detectate. Adesea, rezultatele secventializarilor evidentiaza ca doua secvente de ADN care nu se hibridizeaza intre ele se aseamana sificient (30 la 50%) pentru a fi grupate in cadrul unei familii sau a unei super-familii.

Secventele simple de ADN sunt concentrate specific la nivelul cromozomilor

Figura: cromozomi umani in metafaza colorati fluorescent si hibridizati in situ cu o secevta ADN monocatenara particulara marcata cu un derivat fluorescent al biotinei. Cand se ilumineaza cu o lungime de unda adecvata, ADN apare rosu si in pozitia la care se hibridizeaza secventa monocatenara apare o banda galbena pe cromozomul 16, indicand localizarea secventei numai intr+un singur loc din genom.

Analiza moleculara a relevat ca anumite tipuri de secvente de ADN sunt asociate cu caracteristici morfologice particulare ale cromozomilor. Regiunile numite organizator nucleolar contin genele pentru ARNr. Regiunile telomerice si centromerice ale cromozomilor eucariotici contin secvente repetitive (repetate) in tandem. Asa cum am aratat, cu toate ca adesea aceste reprezinta peste 10% din genom, functiile lor nu sunt cunoscute. Astfel de secvente ar putea sa nu fie importante in functionarea centromerilor deoarece ele lipsesc la cromozomii de drojdii (Saccharomyces cerevisiae) unde centromerii functioneaza normal in cursul mitozei sau meiozei.

Rearanjamentul secventelor ADN

Aranjamentul genelor si a marii majoritati a segmentelor ADN in cromozomi este virtual stabila ceea ce face posibila stabilirea hartilor genetice. Informatia genetica poate fi redistribuita intre cromozomii omologi, fie in timpul meiozei fie in timpul mitozei, prin crossing-over reciproc. Cu toate ca aceste evenimente creeaza noi combinatii de alele, ele nu determina rearanjamente ale secventelor ADN. De fapt, numeroase grupuri de gene sunt mult mai vechi decat speciile individuale, si gene sintenice situate pe acelasi cromozom la un anumit mamifer, sunt adesea prezente si la alte mamifere care nu sunt inrudite din punct de vedere evolutiv. Totusi, acestei stabilitati a organizarii genomului i se suprapune o capacitate de reorganizare a informatiei genetice. Rearanjarea se poate face la intamplare, provocand cel mai adesea mutatii daunatoare, dar anumite rearanjamente sunt procese normale care influenteaza expresia genelor in mod ordonat si programat.

De mult timp se cunosc aberatii cromozomiale cum sunt rupturile, translocarile unor portiuni de cromozom pe un cromozom neomolog sau formarea de cromozomi dicentrici sau acentrici. La nivel molecular, toate aceste modificari morfologice se manifesta prin modificari ale structurii ADN. Toate organismele poseda in programul lor genetic informatia pentru masinaria enzimatica (angrenajul enzimatic) necesara acestor rearanjamente. Acest proces cuprinde: 1) crosiing-over omolog nereciproc si nealelic si conversii genetice; 2) transpozitii de segmente de ADN de la un locus la altul; 3) formarea de copii suplimentare de secvente de ADN fie in tandem fie dispersate, proces numit amplificare; 4) deletia de secvente de ADN; 5) recombinarii neomoloage. Recunoasterea instabilitatii organizarii genomice este una din cele mai mari descoperiri ale geneticii moleculare si este in mod particular remarcabila deoarece rearanjamentele sunt evenimente rare. Aceasta deoarece pentru cea mai mare parte consecinta combinarii preciziei geneticii moleculare cu modalitatile foarte selective ale analizei genetice clasice.

Rearanjamentele genomice aleatoare

Rearanjamentele neprogramate sunt, de obicei, rezultatul hazardului atat in ceea ce priveste momentul in care se produc cat si secventele implicate. Astfel de rearanjamente produc adesea mutatii nefaste. Totusi, ele pot furniza sau au putut furniza in trecut ocazia unor raspunsuri noi mediului si au putut astfel facilita modificarile evolutive. Evident, pentru ca aceste rearanjamente aleatorii sa influenteze evolutia, ele trebuie sa aiba loc in celulele germinale sau in precursorii acestora.; aceleasi evenimente daca au loc in celule somatice raman fara consecinte pentru organismul individual. Totusi, daca celula somatica este o celula susa (celula stem) rearanjamentele aleatoare pot impiedica formarea unei descendente functionale si diferentiate sau modificarea poate fi oncogena si poate conduce la formarea unei tumori.

Printre tipurile cunoscute de rearanjamente genomice aleatoare unul particular a atras atentia cercetatorilor si anume transpozitia segmentelor de ADN de la un situs la altul. Genele mobile au fost vedete chiar si pentru literatura stiintifica de popularizare. Existenta elementelor ADN mobile a pornit de la studiile genetice si citogenetice asupra porumbului care au demarat pentru prima data in anii '40. Douazeci de ani mai tarziu, geneticieni care se ocupau de bacterii au obtinut rezultate experimentale care au condus la aceleasi concluzii: anumite segmente de ADN se pot deplasa. In cele din urma, a fost stabilit ca mai multe tipuri de elemente mobile exista in genomul celulelor eucariote. Clonarea moleculara a facut posibila determinarea structurilor multora dintre aceste elemente si a permis elucidarea mecanismelor prin care se realizeaza schimbarea pozitiei in genom. Elementele mobile sunt factori de modificare genetica si sunt responsabile de diferite mutatii la eucariote cat si la procariote. Cand acestea se insera in secventa codanta a unei gene, functia acesteia se pierde. Cand elementul se insera in vecinatatea unei gene expresia acesteia poate fi influentata complex. De fapt, multe dintre mutatiile care s-au dovedit utile, la inceputul secolului, pentru studiul D. melanogaster sunt la ora actuala cunoscute ca fiind rezultatul inserarii unor elemente mobile in gene.

Rearanjamente programate

Acum este evident ca expresia genelor poate fi modificata profund prin modificarea mediului lor genomic. O gena poate fi silentioasa cand se afla in vecinatatea unui anumit tip de secventa si poate fi exprimata cand secventa de ADN care o flancheaza se modifica. Astfel de rearanjamente sunt utile pentru o mare varietate de organisme pentru reglarea expresiei genelor si stabilirea astfel a unor functiuni specifice in celulele diferentiate. De exemplu, exista programe genetice care provoaca rearanjarea anumitor segmente ADN in momente oportune sau in tipuri specifice de celule.

Mult timp inainte de a putea analiza genele si genoamele la nivel molecular, geneticienii presupuneau ca anumite fenomene biologice neasteptate pot fi explicate prin rearanjamente specifice. Unul dintre acestea era alternanta a doua tipuri de flageli diferiti la nivelul celulelor de Salmonella thyphimurium. Un alt caz, cu implicatii mult mai profunde, era extraordinara diversitate a anticorpilor pe care ii pot produce mamiferele. Analiza moleculara a demonstrat in prezent ca cele doua fenomene, ca si multe altele, sunt rezultatul rearanjamentelor programate ale secventelor ADN (exemplul imunoglobulinelor este redat in figura 7). In aceste doua exemple, reorganizarea genomului este folosita pentru a proteja organismul. Prin schimbarea flagelilor, Salmonella scapa de apararea imunologica a organismului gazda. Prin crearea de noi anticorpi organismul se apara mai bine de agentii externi.

Implicatii evolutive

Istoria evolutiei organismelor este inscrisa in genomul lor. Mutatiile si rearanjamentele furnizeaza variatiile genetice de care depinde procesul evolutiv. In trecut, relatiile evolutive nu puteau fi studiate decat prin raportare la consecintele asupra informatiei genetice oglindite in fenotipurile organismelor. Astfel, informatia biologica era furnizata de studiul anatomic al fosilelor si de anatomia, fiziologia si embriologia comparata a speciilor contemporane. La mijlocul acestui secol, chimia comparativa a proteinelor a introdus o alta masura fenotipica a relatiilor filogenetice. Descoperirea ca structura anumitor proteine este conservata la un larg spectru de organisme a asamblat mai multe ramuri (philum) in cai de evolutie comune intr-un mod in care studiul fosilelor nu il putea face. De exemplu, citocromul C, este prezent in mitocondriile tuturor plantelor si animalelor. El este indispensabil respiratiei si trebuie sa fie printre primele molecule proteice esentiale. In cursul evolutiei, citocromul C s-a modificat foarte putin (figura 8); numai 35 din cei 104 aminoacizi ai citocromului C s-au modificat de la drojdii la m (fara a tine cont de aminoacizii terminali suplimentari care exista in proteina de la drojdii).

Citocromul C si alte proteine foarte conservate nu sunt utile in analiza genetica a relatiilor filogenetice intre specii foarte inrudite deoarece in acest caz nu exista prea multe variatii: este cazul citocromului C de la om si de la cimpanzeu. Dar alte proteine evolueaza mult mai rapid. Un exemplu este anhidraza carbonica: diferentele din structura sa la nivelul primatelor sunt suficiente pentru a putea stabili un arbore filogenetic. Aceasta metoda se bazeaza pe observatia ca numarul aminoacizilor diferiti este groso-modo proportional cu timpul scurs intre divergenta de stramosul comun, asa cum o demonstreaza si datele obtinute prin analiza fosilelor.

In fine, toate metodele de analiza a procesului evolutiv care se bazeaza pe expresia fenotipica sunt indirecte deoarece responsabile de aparitia unor noi fenotipuri sunt modificarile pe care le sufera genele si genoamele. Chiar daca studiul formelor stravechi se va continua prin studiul fosilelor, compararea structurilor ADN va suplini rapid celelalte metode in studiul relatiilor existente intre speciile contemporane. Astfel, tehnica ADN recombinat a avut deja un impact major asupra biologiei evolutiei si cu siguranta influenta sa in acest domeniu va fi enorma in viitor. 

Genatica moleculara comparativa

Chiar inainte de a avea posibilitatea de a clona si secventializa, importanta compararii diferitelor secvente de ADN in studiul evolutiei era evidenta, diferite metode de masurare a gradului de inrudire dintre genoame fiind dezvoltate pe parcurs (in timp). Aceste tehnici includeau compararea stabilitatii dublului helix ADN format din monocatene de origini diferite (heteroduplex) sau a catenelor cu aceeasi origine (homoduplex). In figura 9 sunt aratate rezultatele obtinute pentru diferite specii de Drosophila. Cu toate ca erau utile, studiile de acest tip nu dadeau decat valori medii pentru divergenta dintre doua tipuri de ADN. Alelele nu pot rivaliza cu bogatia detaliilor obtinute prin anatomie comparata sau biochimia proteinelor. In aceste conditii comparatiile directe ale secventelor nucleotidice ADN furnizeaza detalii importante si clarifica aspectele care inainte nu puteau fi abordate evolutiv. Astazi, este mult mai usor tehnic sa se realizeze clonarea si secventializarea unui grup omolog de gene decat sa se izoleze si sa se determine secventa in aminoacizi a produsilor peptidici ai acestora.

In ceea ce priveste regiunile codante, secventa ADN furnizeaza mai multe informatii decat secventa peptidica deoarece degenerescenta codului genetic permite o modificare a structurii genei fara modificarea secventei in aminoacizi corespunzatoare. Dealtfel, faptul ca putem sti ca un aminoacid s-a schimbat nu indica neaparat numarul de modificari care au intervenit la nivelul perechilor de baze; nu este permisa decat o estimare a numarului minim de modificari necesare inlocuirii unui aminoacid de catre altul. Astfel, inlocuirea unei alanine cu o valina in pozitia 11 a citocromului C (figura 8) poate fi rezultatul modificarii uneia (GCU GUU) sau a doua(GCU GUA) perechi de baze.

Un avantaj unic al secventelor ADN este ca se poate realiza compararea secventelor necodante, implicit a secventelor reglatoare. Acest lucru poate avea o importanta foarte mare pentru faptul , deja recunoscut, ca evolutia proteinelor si evolutia morfologica se realizeaza cu viteze diferite in grupe diferite de organisme. Modificari fenotipice importante pot reprezenta nu numai rezultatul structurii proteinelor dar si , de exemplu, a abundentei relative a proteinelor individuale in momentul expresiei genelor. Compararea secventelor ADN poate elucida rolul reglarii unei gene in evolutia speciilor prin analiza elementelor situate in vecinatatea secventelor genice luate in studiu. Aceste modificari pot, in anumite cazuri, implica numai modificarea unei singure perechi de baze dar pot exista si rearanjamente genomice importante cum ar fi transpozitiile de elemente mobile.

Secventele de ARNr, si particular cele de ARN 16 si 18S care intra in constitutia subunitatilor mici ale ribozomilor, sunt foarte utile pentru determinarea relatiilor filogenetice. Cum ribozomii sunt abundenti la toate speciile, molecule de ARN functional pot fi izolate si secventializate direct dupa trecerea lor in ADNc. Cu toate ca functia subunitatii mici este aceeasi la toate organismele vii, regiunile moleculei poseda grade variabile de conservare. Regiunile cele mai conservate pot fi utilizate pentru a compara organismele cu grade de inrudire slabe (indepartate evolutiv) si segmentele care evolueaza mai rapid in compararea organismelor cu grad de inrudire mai mare. Astfel, toate speciile pot fi comparate folosind un singur tip de molecula a carei functie a fost foarte bine conservata. Astfel, au fost analizate specii virtual reprezentative pentru toate clasele taxonomice putand fi analizate relatiile filogenetice detaliate ti realizandu-se clarificarea unor momente ale procesului evolutiv.

Istoria evolutiei genelor

Pana in prezent, evolutia a fost analizata din punct de vedere al relatiilor cu istoria diferitelor specii. Dar o alta istorie biologica este inscrisa in structura ADN, in cunoasterea originii genelor. Doua sau mai multe gene (sau secvente de ADN) inrudite in aceeasi specie deriva adesea dintr-o singura secventa ancestrala. Daca segmentul ADN ancestral a fost amplificat (ca urmare a unor evenimente aleatoare), o singura copie poate fi suficienta pentru realizarea functiei originale. Mutatiile ce pot sa apara in copiile suplimentare si care sunt libere de constrangerea ce determina limitarea acumularii mutatiilor in gena functionala pot conduce la noi capacitati functionale, care la randul lor, pot fi pastrate de catre selectie. Copiile suplimentare pot de asemenea achizitiona semnale de reglare noi sau modificate care le pot permite sa se exprime in momente diferite ale evolutiei sau in tesuturi particular diferentiate. O alta posibilitate este ca copiile suplimentare sa fie inactivate prin mutatie si sa fie mentinute sub forma de pseudogene. Familia genelor globinei contine exemple pentru toate cele trei posibilitati (figura 5).

Anumite gene par sa se fi format prin asocierea copiilor de secvente codante (cazul exonilor). In anumite cazuri aceasta implica amplificare in tandem a unui singur exon, structura repetitiva a genei regasindu-se in multiplele repetitii ale segmentelor peptidice inrudite in proteina (figura 10). In alte cazuri, genele par sa fie o constructie in mozaic formata din exonii prelevati din diferite gene (figura 11). Astfel, exonii avand un stramos comun pot sa apara in mai multe gene care nu par a avea un grad de inrudire. Exonii existenti in mai multe proteine codifica probabil pentru domenii care dau acestor proteine diferite proprietati structurale sau functionale inrudite, cum ar fi o structura secundara particulara sau capacitatea de a fixa un anumit ligand (ex., ATP).

O ipoteza interesanta privind asamblarea genelor prin repetitia sau amestecul exonilor propune existenta anumitor recombinari la nivelul intronilor care servesc la asocierea exonilor, lasand intacte regiunile codante. Aceasta maniera de a vedea lucrurile implica acceptarea faptului ca intronii sunt structuri stravechi, prezente inca in primele gene si celule si care au fost pierdute in cursul evolutiei procariotelor. O alta ipoteza total diferita considera ca intronii reprezinta insertii la nivelul regiunilor codante preexistente printr-un mecanism mai frecvent la eucariote decat la procariote. Ideea ca intronii sunt stravechi rezolva multe probleme inerente privind explicarea modelului de insertie, si printre altele problema mutatiilor care pot interveni in cazul inserarii generalizate si la intamplare a segmentelor necodante si a necesitatii de a elabora simultan un mecanism de excizie. Din contra, daca intronii erau prezenti in primele genoame, excizia si episajul trebuia sa fie procese stravechi. Descoperirea ca anumiti introni provoaca propria lor eliminare fara ajutorul proteinelor a crescut sansele ipotezei existentei anumitor introni din timpuri foarte stravechi. Totusi, deplasarea intronilor de pe un segment de ADN pe altul a fost bine caracterizata in multiple cazuri. exemplele cunoscute, care se refera la intronii genelor mitocondriale de la drojdii si genelor pentru ARNr de la Mixobacterii, formeaza o clasa aparte de introni (grupul I). Insertia pare sa fie rezultatul unei conservari genetice specifice unui anumit situs. Intronii putea sa apara in diferite moduri.

Compararea structurilor proteice a furnizat suficiente date pentru a permite formularea de diverse ipoteze privind rolul procesului de amplificare in evolutia genomului. Totusi, de cand exista posibilitatea clonarii genelor, aceste ipoteze au fost puternic extinse si imbogatite. Unul dintre punctele importante, demonstrate prin analiza moleculara, este ca procesul de amplificare, de divergenta, de repetitie si de amestec de exoni nu sunt rare si nu constituie numai contributii ocazionale in evolutia genomului. Istoria unei parti importante a ADN de la eucariote, secventele codante sau necodante contopite reflecta un astfel de proces. Varietatea rearanjamentelor observate in genoamele contemporane reflecta procese stravechi care au fost, si probabil sunt inca, motoarele esentiale ale modificarilor aparute in cursul evolutiei.

Originea sistemelor genetice

Intrebarea care se pune este daca vechimea intronilor poate furniza informatii despre primele sisteme genetice si daca poate raspunde intrebarii privind natura primelor molecule purtatoare de informatie: ADN sau ARN ?. Exista o serie de argumente in favoarea ipotezei ca ARN a aparut primul si ca a furnizat bazele primelor sisteme de codificare. De exemplu, moleculele de ARNr, ARNt si ARNm reprezinta elemente centrale in sistemul de translatie, in aparatul de traducere al intregului organism si de interpretare a codului genetic. Aceasta sugereaza ca aceste molecule au precedat divergenta dintre procariote si eucariote si ca trebuie sa fi fost prezente in primele sisteme genetice. In plus, molecule mici de ADN pot fi sintetizate de pe o matrice ARN, intr-o maniera pur chimica, in absenta oricarei proteine. Deci, este posibil ca moleculele de ARN sa fi avut capacitati autoreplicative si sa fi putut fi transcrise si traduse dupa mecanisme primitive. Moleculele de ARN pot de asemenea reactiona ca enzime pentru a modifica alte molecule de ARN. Fractia ARN a RN-azei din E. coli catalizeaza clivarea specifica a unui situs la nivelul precursorilor ARNr. Asa cum s-a mentionat deja, intronii precursorilor ARNr de la anumite protozoare si drojdii pot fi clivati fara interventia proteinelor. Din contra, moleculele de ADN nu sunt capabile de astfel de reactii.

Deci, stramosul sistemelor genetice contemporane se poate sa fi utilizat molecule ARN informationale (figura 12). In aceste molecule de ARN, scurte regiuni codante formate la intamplare (exonii primitivi) puteau alterna cu regiuni necodante (intronii primitivi). La un moment dat au aparut polipeptide mici care facilitau maturarea ARN si replicarea acestuia. Una dintre aceste ar fi putut avea activitate de transcriptaza inversa, catalizand formarea de molecule de ADN care au putut deveni, mai tarziu, formele de stocarea informatiei genetice celulare. Aceste molecule de ADN au putut conserva alternanta exon-intron existenta in ARN. Sistemul genetic care contine ADN a devenit astfel stramosul organismelor celulare. O evolutie divergenta ar fi putut da nastere liniilor de eucariote si de procariote in care retinerea sau pierderea intronilor au fost respectiv favorizate. Dupa acest model, mu este surprinzator sa gasim ocazional un intron prezent intr-un genom procariot. De fapt, in genomul bacteriofagului T4 al E. coli exista introni, la fel ca si in genele ARNt de la archeobacterii (in ultimul timp au fost descoperiti si alti introni la procariote si archeobacterii).

Unul dintre aspectele cele mai tulburatoare ale modelului descris in figura 12 este originea independenta, plecand de la celule ancestrale, a procariotelor si eucariotelor. Anterior, cea mai mare parte a speculatiilor referitor la debuturile evolutiei presupuneau ca eucariotele deriva din procariote. Aceasta ipoteza se baza pe ideea ca celulele procariote contemporane, relativ simple, se aseamana cu celulele primitive in timp ce celulele eucariote, rezultate din procariote mai simple, au devenit in cursul evolutiei mai mari si mai complexe. Descoperirea intronilor, a maturarii (splicing) fenomenelor de transcriptie celulara inverse si a proprietatilor catalitice ale ARN au fortat cercetatorii sa reevalueze vechile concepte. Cu siguranta capacitatea noastra de a analiza aspectele moleculare ale sistemelor biologice informationale ne va ajuta din ce in ce mai mult sa raspundem intrebarilor esentiale pe care le ridica biologia evolutiei.

Tehnica "fingerprinting" se bazeaza pe diferenta de lungime a secventelor simple de ADN

Figura: Secvente consens ale unitatii repetitive a minisatelitilor umani numiti l33.1 si l33.5 bazate pe anliza a mai mult de zece seturi de unitati repetitive pentru fiecare caz. Literele rosii indica pozitiile la nivelul carora au fost identificate diferente. Punctele rosii indica deletii. Unitatea de 62 pb a l33.1 este mult mai conservata decat unitatea de 17 pb a minisatelitului l

Minisatelitii sunt folositori in cartarea genetica

Secventele care se aseamana satelitilor prin faptul ca sunt constituite din repetitii in tandem ale unei unitati scurte, dar mult mai scurte, constand in (de exemplu) 5-50 repetitii, sunt comune genoamelor de la mamifere. Acestea au fost descoperite din intamplare ca fragmente a caror marime este extrem de variabila in bancile genomice de ADN genomic uman. Variabilitatea se poate constata (vedea) cand o populatie contine fragmente de marimi diferite care reprezinta aceeasi regiune genomic; cand indivizii sunt examinati, se avidentiaza existenta unui polimorfism extins si faptul ca pot fi gasite alele diferite.

Aceste secvente sunt numite minisateliti sau regiuni VNTR (variable number of tandem repeats). Cauza variatiilor este aceea ca alelele individuale au numere diferite de unitati repetitive. De exemplu, un astfel de minisatelit are o lungime repetitiva de 64 pb, si se gaseste in populatie avand urmatoarea distributie:

7% 18 repetitii

11% 16 repetitii

43% 14 repetitii

36% 13 repetitii

4% 10 repetitii

Cauza acestei variatii este recombinarea genetica intre unitatile repetitive necomplementare (misaligned), in acelasi mod in care am discutat deja pentru ADN satelit. Rata de modificare genetica a secventelor minisatelit este mare, 10-4 per kb de ADN. (Frecventa modificarilor per locus actual se considera a fi proportionala cu lungimea unui minisatelit). Aceasta rata este de 10x mai mare decat rata recombinarii omologe in meioza, care este caracteristica oricarei secvente ADN aleatoare. Deci satelitii pot fi considerati puncte fierbinti pentru recombinarea meiotica.

Adesea prezenta unui minisatelit este corelata cu o rata crescuta (ridicata) de modificare (schimb) in vecinatate, dar in umele cazuri evenimente de recombinare apar intre cromatde surori (in astfel de cazuri se modifica lungimea minisatelitului dar nu sunt afectati markerii care il flancheaza pe acesta, deoarece sunt identici pentru ambele molecule recombinate de ADN).

Variabilitatea crescuta a minisatelitilor ii face pe acestia extrem de utili pentru cartarea genomica, deoarece exista o mare probabilitate ca indivizii sa prezinte variatii ale alelelor prezente la nivelul unor astfel de locusuri. Un exemplu de cartare cu ajutorul minisatelitilor este ilustrat in figura 25.10. SE prezinta un caz extrem in care doi indivizi, ambii heterozigoti pentru un locus minisatelit, si de fapt pentru toate cele patru alele sunt diferiti. In mod normal, toti descendentii vor mosteni o alela de la fiecare parinte fiind astfel posibila fara ambiguitate determinarea sursei fiecarei alele ale progeniturii. In terminologia geneticii umane, meiozele descrise in aceasta figura sunt foarte informative, datorita variatiei dintre alele.

O familie de minisateliti a fost determinata in genomul uman ca prezentand o secventa 'core' comuna. Secventa 'core' este o secventa bogata intr-o secventa de 10-15 pb bogata in G-C., cu o asimetrie a distributiei prinelor/pirimidinelor pe cele doua catene. Fiecare minisatelit individual contine o varianta a secventei 'core', dar 1000 minisatelitipot fi detectati pe Southern blot cu ajutorul unei sonde care consta in secventa 'core'.

Sa consideram ca situatia prezentata in figura 25.10 trebuie multiplicata cu 1000x. Efectul variatiei la nivelul locilor individuali este de a crea un profil unic pentru fiecare individ. Aceasta face posibila desemnarea fara ambiguitate a ereditatii dintre parinti si progenitura, aratand ca 50% dintre benzile oricarui individ sunt derivate de la un anumit parinte. Acestea stau la baza tehnicii numite 'ADN fingerprinting'

Sumar

ADN satelit consta din secvente foarte scurte repetate de mai multe ori in tandem. Proprietatile distincte manifestate la centrifugare reflecta compozotia in baze. ADN satelit este concentrat in heterocromatina, dar functia sa este necunoscuta. Unitatile repetitive individuale din satelitii artropodelor sunt identice. Cele ale satelitilor de la mamifere sunt corelate, si pot fi organizate intr-o anumita ierarhie care reflecta evolutia satelitului prin amplificarea si divergenta secventelor alese la intamplare. Crossing-overul inegal pare sa fie un determinant major in organizarea ADN satelit. Fixarea crossing-over explica capacitatea variatiilor de a se intinde intr-un cluster. Minisatelitii au proprietati similare satelitilor, dar sunt mult mai mici; ei sunt foarte utili pentru cartarea genomica.

Imagini "fingerprint" ADN uman

Probe de ADN de la trei indivizi care au fost supuse unei analize Southern Blot folosind enzima de restrictie Hinf1 si trei minisateliti marcati drept sonde: l33.5, 33.15 si 33.5. ADN de la fiecare individ produce un profil unic pentru fiecare proba. Conditiile de electroforeza pot fi ajustate astfel incat cel putin 50 de benzi sa fie rezolvate pentru fiecare persoana cu aceasta enzima de restrictie. Neidentitatea celor tri probe este usor de evidentiat.

Mari familii de repetitii dispersate in genomul mamiferelor

Analiza clasica a profilelor de dispersie demonstreaza ca genomul uman si genoamelor altor de mamifere poseda profile de dispersie apropiate. Aceste concluzii sunt confirmate de detaliile moleculare furnizate prin analiza de restrictie si prin clonare si secventializare. Cu toate ca exista diferite familii si sub-familii de repetitii dispersate, un numar mic dintre acestea prezinta un numar foarte mare de copii si domina genoamele. O familie dominanta poate reprezenta mai mult de 5% din ADN total, iar totalitatea familiilor pot reprezenta 20% din acesta. Anumite familii sunt constituite din secvente de 100 la 500 pb si sunt denumite 'secvente SINES' ('Short Interspersed Repeats). Altele, ale caror membri pot avea 6 kpb si mai mult, sunt denumite LINES (Long Interspersed Repeats). Alte organisme cum sunt miomicetele, lacustele, echinodermele, pestii si amfibienii contin repetitii dispersate care se aseamana cu SINES de la mamifere. La plante si la nevertebrate exista secvente comparabile cu LINES de la mamifere.

SINES

Secventele scurte, foarte repetitive si dispersate de la mamifere au fost inca de la inceput adunate sub denumirea SINES pur si simplu pe baza lungimii si abundentei lor. O proprietate comuna mai semnificativa a fost descoperita recent. SINES par sa fie pseudogene mature derivate din genele din clasa III care codifica pentru mici molecule de ARN citoplasmatic, printre care si moleculele de ARNt ((figura 9.39, pag 681, G&G) si cele pentru ARN 7SL (figura 9.40, pag 681, G&G). Deci, SINES sunt omologe cu secventele acestor ARN (sau ale genelor lor). SINE sunt adesea flancate de repetitii directe care sunt duplicate ale secventelor tinta inserate si poseda secvente 3' terminale bogate in A.

Fiecare specie (sau fiecare ordin) poseda 'un joc' caracteristic de familii de secvente SINES. Pentru a ilustra complexitatea si diversitatea acestor secvente vom da cateva exemple. Una dintre familiile SINES cele mai bine studiate este familia ALU de la primatele lumii vechi, denumita asa datorita prezentei in aceasta secventa a unui situs de restrictie Alu I. Unitatile Alu se gasesc in regiuni care flancheaza genele, in introni, in ADN satelit si grupate cu alte secvente repetitive dispersate. Pentru o anumita specie determinata, secventele Alu diverg una de alta cu aproximativ 15% : Cand primatele lumii vechi sunt comparate intre ele, secventele membrilor familiei Alu variaza la fel ca in interiorul unei singure specii.

Secventele Alu tipice primatelor sunt dimere, compuse din doua secvente de aproximativ 130 pb (figura 9.40 pag 681, G&G). Cei doi monomeri repetitivi nu sunt identici iar diferenta cea mai marcanta este prezenta unui segment suplimentar de 31 pb in cea de a doua unitate. Fiecare monomer se termina (in pozitia 3' a catenei superioare reprezentata in figura 9.40) cu o serie de resturi A de lungime variabila. Monomerii Alu contin secvente omologe cu regiuni 5' si 3' ale moleculelor ARN 7SL; cele 155 pb centrale ale ARN 7SL sunt absente in secventele Alu.

Primele secvente din familia Alu au fost izolate si clonate plecand de la ADN uman (figura 9.41, pag 682, G&G). A fost stabilita o secventa consens. Membrii clonati din familia Alu au fost apoi folositi ca sonde pentru a determina numarul de copii folosind metoda de analiza a cineticii de reasociere. Rezultatele indica prezenta a aproximativ 9 x 105 copii par genom haploid (aproximativ 9% din totalul ADN de la om). In medie, o secventa Alu este prezenta la fiecare 5 kpb in genomul uman si in cel al altor primate ale Lumii vechi. Mai mult de 90% dintre fagii prezenti intr-o banca genomica umana tipica se hibridizeaza cu o sonda Alu, si cea mai mare parte a segmentelor de 15 -20 pb clonate contin mai mult de un membru al acestei familii. Secventele Alu vecine pot avea orientari opuse. Acestea pot fi incluse in fractia de 'ADN genomic pliat'. De exemplu, cinci din opt secvente Alu prezente intr-un fragment de 65 kpb de ADN uman care contine familia multigenica a b-globinei sunt orientate in directia 'sens' si trei in directia 'antisens' (figura 9.42. pag 683, G&G).

Daca consideram ca nu exista decat trei gene functionale care codifica pentru ARN 7SL in ADN uman, caracterul ubicuitar al secventelor Alu este remarcabila. In plus, aparitia acestor secvente Alu la primate trebuie sa se fi produs dupa divergenta majora a ordinelor mamiferelor in cursul evolutiei. Aceasta afirmatie este sustinuta si de faptul ca familia SINE la rozatoare care este omologa cu genele pentru ARN 7SL, este net diferita de familiile Alu de la primate (figura 9.40). Cele 105 copii ale familiei de tip I de la razatoare au aproximativ 130 pb, adica sunt echivalentul unuia dintre cei doi monomeri repetitivi directi tipici familiei Alu de la primate. Alte secvente SINES de la rozatoare, cum sunt familiile de tip II si ID. sunt omologe cu diferite gene pentru ARNt (figura 9.39).

Omologia dintre membrii familiei SINE si genele din clasa III cu care acestea sunt inrudite includ elemente promotoare interne, cum sunt cutiile A si B, unitatile SINES continute in segmente de ADN clonate fiind adesea transcrise in vitro de catre ARN polimeraza III (figura 9.46, pag 683, G&G). Transcriptia incepe foarte precis la extremitatea 5' a unitatii si se termina la nivelul primului grup care contine patru resturi A sau mai multe de pe catena considerata matrice. Totusi, in ciuda faptului ca unitatile SINE pot fi transcrise efectiv in vitro, cea mai mare parte dintre ele nu sunt matrite active pentru ARN polimeraza III in vivo. Modelele cele mai interesante care au fost propuse pentru a explica modul de amplificare a secventelor SINES si inserarea lor in ADN fac apel la interventia unui proces de transcriptie inversa realizat de catre ARN polimeraza III.

Secventele SINE sunt transcrise si de catre ARN polimeraza II. Este cazul SINE prezente in introni, la nivelul secventei '5' leader' sau a cozii 3' a unei unitati de transcriptie din clasa II ne-inrudita. Din aceasta cauza, moleculele de ARNhn contin numerosi transcripti ai secventelor SINE repartizati printre alte secvente. In urma maturarii unui transcript primar in ARNm, secventa SINE este in general eliminata astfel incat ARN citoplasmatic contine de doua ori mai putine secvente SINE decat ARN nuclear.

LINES

Pe langa multiplele familii SINES, genoamele mamiferelor poseda toate o abundenta familie LINES, familia LINE-1, ale carei membri pot avea 6 la 7 kpb (figura 9.44, pag 684, G&G). Alte familii LINE exista in unele dintre aceste genoame dar ele nu sunt la fel de frecvente. Familiile LINE-1 de la diferite mamifere sunt toate inrudite dar divergente: cu cat speciile sunt mai inrudite cu atat familiile sunt mai similare. Mai multi membri ai familiei LINE-1au mai putin de 6 la 7 kpb. Astfel de segmente trunchiate sunt in general deposedate de secventele situate la extremitatea 5' (in stanga pe reprezentarea din figura 9.44). Adesea, secventa interna lipseste (secventele reprezinta o deletie in raport cu membrii mai lungi ai familiei). In plus, toti membri familiei nu sunt colineari. La unii dintre acestia, exista regiuni inversate sau rearanjate unele in raport cu altele. Exista mult mai multi membri trunchiati decat membri cu lungime normala in genoamele de soarece si de la primate. In consecinta, numarul de copii par genom ale sub-regiunilor secventelor lungi LINE-1 variaza, si creste de la extremitatea stanga la extremitatea dreapta (pe figura 9.44). De exemplu, la om exista aproximativ 3,5 x 103 copii de secvente la extremitatea stanga si aproximativ 105 copii de secvente la extremitatea dreapta.

Secventele LINE-1 sunt prezente in regiunile flancante ale genelor, in introni si inserate in repetitiile ADN satelit. Analiza membrilor familiei LINE-1 pe segmente genomice clonate, ca si hibridizarea in situ a sondelor LINE-1 cu cromozomi intregi, demonstreaza ca secventele LINE sunt dispersate in numeroase situsuri cromozomice. Nu se stie daca dispersia este aleatoare sau nu. Anumite situsuri pot contine grupe de LINE-1. De exemplu, exista un numar surprinzator de membri ai familiei intr-un segment de 65 kpb de ADN uman care contine genele b-globinei (figura 9.42).

Asemeni secventelor SINE, unitatile LINE-1 sunt adesea inconjurate de repetitii directe scurte care par sa fie duplicari ale situsurilor tinta., si ele poseda un segment 3' terminal bogat in A. Totusi, contrar SINE, unitatile LINE-1 nu par sa fie versiuni pseudo-genice ale unor gene ordinare. Unele din unitatile cele mai lungi ale LINE-1 pot fi mai degraba elemente mobile care au fost amplificate si transpozate intr-un situs nou in genom printr-un mecanism care implica transcriptia intr-un ARN intermediar, apoi transcriptia inversa in ADN. Transcriptaza inversa poate fi codificata de o regiune de aproximativ 4 kpb a unitatii LINE-1, o portiune care este relativ bine conservata printre speciile de mamifere si care contine un cadru de lectura lung

la nivelul celor doua catene (figura 9.44). Unitatile LINE-1 trunchiate si rearanjate ar putea proveni din transcripti sau din transcripti inversi aberanti sau incompleti, sau in urma unor evenimente aleatoare de recombinare care insotesc inserarea.

Secventele familiei LINE-1 sunt transcrise in momentul in care ARN polimeraza II citeste regiunea ne-codanta a unei gene, in care un membru al familiei este inserat. In consecinta, molecule omologe de ARN cu fiecare catena a secventelor LINE-1 sunt relativ abundente in ARNhn. Nu au fost detectati transcripti in ARN citoplasmatic poliadenilat decat in linii celulare de teratocarcinom uman sau de limfocite de soarece care contin transcripti completi ai catenei purtatoare de faza deschisa de lectura. Nu a fost identificata nici o proteina codificata de acest ARN.

Densitatea de flotatie a ADN de la D. virilis

Secventele inalt repetitice sunt adesea pozitionate la nivelul centromerilor. Este exemplu comportamentului satelitilor de la D. Virilus (centrifugare in gradient de CsCl). Densitatea de flotatie creste odata cu cresterea continutului in G+C.

Secventele de ADN satelit sunt adesea corelate in heterocromatina

Densitatea de flotatie a duplexului ADN depinde de continutul sau in G-C in concordanta cu formula empirica:

D = 1, 660 + 0,00098 (%G-C) g/cm3

Densitatea de flotatie este determinata in mod normal prin centrifugare in gradient de densitate de CsCl. ADN formeaza o banda in pozitia corespunzatoare propriei sale densitatii. Fractiile de ADN care difera printr-un continut de G-C mai mare de 5% pot fi separate normal in gradient de densitate.

Cand ADN eucariotic este centrifugat in gradient de densitate, pot fi distinse doua tipuri de material:

n    majoritatea ADN genomic formeaza o banda de fragmente continue care ca un pic destul de larg centrat la nivelul densitatii corespunzatoare continutului in G-C al genomului. Aceata formeaza banda principala.

n    adesea se poate observa un pic mai mic (sau picuri) la o valoare diferita a densitatii. Acest material este denumit 'ADN satelit'.

Satelitii sunt prezenti in multe genoame eucariote. Acestia pot avea fie o densitate mai mare fie una mai mica decat banda principala. Ceea ce au in comun aceste secvente este ca ele reprezinta > 5% din ADN total. Un exemplu clar este oferit de ADN dela D. virilus. Graficul reprezinta o scanare cantitativa a benzilor obtinute cand se realizeaza centrifugarea ADN genomic in gradient de CsCl. Banda principala contine 92% din ADN genomic si este centrata la nivelul unei densitati de flotatie de 1, 701g/cm3 (corespunzatoare unui continut de G-C de 42% tipic si pentru mamifere, de exemplu soarece). Picul mai mic reprezinta 8% din genom si poseda o densitate de flotatie distincta de 1, 6 g/cm3. Aceasta contine ADN satelit de soarece, al carui continut in G-C corespunde valorii de 30%, mult mai scazut decat alte regiuni din genom.

Comportamentul ADN satelit in gradient de densitate este adesea anormal. Cand se realizeaza determinarea compozitiei in baze a satelitilor, se poate constata ca aceasta este diferita de densitatea dedusa prin evaluarea densitatii de flotatie. Motivatia acestui fapt este aceea ca r nu depinde stric de compozitia in baze, ci de constitutia secventei in ceea ce priveste capacitatea de imperechere a secventelor alaturate. De exemplu, pentru secventele simple, acestea prezinta un comportament deviat de la relatiile de imperechere aleatoare necesare pentru a corespunde ecuatiei densitatii de flotatie. De aemenea, ADN satelit poate fi metilat, ceea ce modifica densitatea sa.

Adesea majoritatea secventelor de ADN inalt repetitive dintr-un genom pot fi izolate sub forma de sateliti. Cand un component de ADN inalt repetitiv nu se separa asemeni uni satelit, dupa izolare proprietatile sale se pot dovedi adesea similare cu cele ale ADN satelit. Aceasta inseamna ca ele constau in repetitii multiple in tandem care se caracterizeaza prin centrifugare anormala. Materialul izolat in acest fel este adesea denumit 'ADN satelit criptic'. Regiunile 'ADN satelit criptic si aparent' formeaza impreuuna blocurile de unitati repetitive in tandem de ADN inalt repetitiv. Cand un genom poseda mai mult de un tip de ADN inalt repetitiv, fiecare tip exista sub forma unui bloc propriu (adesea blocuri diferite pot avea pozitii adiacente).

Unde sunt localizate in genom blocurile de ADN inalt repetitive? O extindere a tehnicilor de hibridizare a acizilor nucleici permite ca localizarea secventelor satelit sa fie determinata direct prin complementare pe cromozom. Tehnica de hibridizare in situ sau de hibridizare citologica presupune denaturarea ADN cromozomal prin tratarea celulelor dupa au fost etalate (strivite) pe o lama. Apoi se adauga o solutie care contine o sonda ADN sau ARN radioactiva. Sonda hibridizeaza cu secventele sale complementare din genomul denaturat. Localizarea situsurilor de hibridizare poate fi determinata prin autoradiografie

Astfel secventele de ADN satelit au putut fi localizate la nivelul heterocromatinei. Heterocromatina este termenul folosit pentru descrierea regiunilor de pe cromozom care sunt permanent strans condensate, in contrast cu eucromatina prezenta in majoritatea genomului. Heterocromatina se gaseste de obicei la nivelul centromerilor (regiunile unde kinetocorii sunt formati in mitoza si meioza pentru a controla miscarea cromozomului).

Localizarea centromerica a ADN satelit la nivelul centromerilor sugereaza existenta unei functii structurale in cromozom. Aceasta functie poate fi corelata cu procesul de segregare a cromozomului. Pentru moment aceasta este singura informatie pe care o avem despre rolul sau. In concordanta cu secventa lor simpla si condensata, satelitii ADN nu sunt transcrisi sau tradusi.

Satelitii de la artropode poseda repetitii identice foarte scurte

La artropode, simbolizate de insecte si de crabi, fiecare satelit pare sa fie mai degraba omogen. In mod normal, o singura unitate repetitiva foarte scurta reprezinta mai mult de 90% din ADN satelit. Aceasta a facut ca aceste secvente sa fie mult mai usor de determinat.

Drosophila virilis are trei sateliti major si un satelic criptic, care impreuna reprezinta > 40% din genom. Secventele satelitilor sunt prezentate in figura. Cei trei sateliti majori prezinta secvente strans inrudite. Substitutia unei singure baze este suficienta pentru a genera satelitii II si III din secventa satelitului I.

Secventa satelitului I este prezenta si la alte specii de Drosaphila inrudite cu virilis. Secventele satelitilor II si III par sa fie specifice pentru D. virilis, care este posibil sa fi aparut din satelitul I dupa speciatie.

Satelitii ADN de la D. virilis sunt inrudite. Mai mult de 95% din structura fiecarui satelit consta in repetitii in tandem a secventei predominante.

Trasatura principala a acestor sateliti este aceea ca sunt unitati repetitive foarte scurte: numai 7 pb. Sateliti similari au fost evidentiati si la alte specii. D. melanogaster prezinta o varietate de sateliti , multi dintre acestia contin unitati repetitive foarte scurte (5, 7, 10 sau 12 pb). Sateliti cu structuri comparabile au fost determinati si la crabi.

Relatiile stranse gasite intre satelitii de la D. virilis nu este neaparat o trasatura si a altor genoame, unde satelitii pot avea secvente neinrudite. Fiecare satelit a aparut ca urmare a unei amplificari laterale ale unei secvente foarte scurte. Aceasta secventa poate reprezenta o varianta a unui satelit anterior (ca si la D. virilis), sau poate avea o alta origine.

Satelitii sunt generati si pierduti continuu din genom. Acest lucru face dificila determinarea unor relatii evolutive, daca un anumit satelit curent ar fi putut sa evolueze dintr-un satelit anterior care apoi a fost pierdut. O trasatura importanta a acestor sateliti este aceea ca ei reprezinta lanturi lungi de ADN ce contin secvente de complexitate foarte scazuta, in interiorul carora poate fi mentinuta constanta acestor secvente.

O trasatura a multora dintre acesti sateliti este o pronuntata asimetrie in orientarea perechilor de baze pe cele doua catene. In exemplu satelitilor de la D. virilis. prezentat in tabelul 25.1., in fiecare dintre satelitii majori una dintre catene fiind mai bogata in baze T si G. Aceasta creste densitatea de flotasie, astfekl incat dupa denaturare catena grea (heavy strand-H) poate fi separata de catena sa complementara (light strans L). Acest lucru poate fi foarte util in secventializatea satelitului.

Organizarea diferitelor gene pentru ARNr

Genele pentru ARNr contin o unitate repetitiva in tandem

In majoritatea cazurilor discutate, exista diferente intre membrii individuali ai unui cluster de gene care permit presiunii selective sa actioneze independent asupra fiecarei gene. O situatie insera este furnizata de doua cazuri de clustere mari de gene care contin multe copii identice ale aceleiasi sau acelorasi gene. O astfel de situatie ridica cateva intrebari interesante asupra evolutiei. Majoritatea organismelor contin mai multe copii ale genelor care codifica pentru proteinele histonice care sunt componente majore ale cromozomilor; exista putine organisme care nu contin copii multiple ale genelor care codifica pentru ARNs ribozomal.

ARN ribozomal este indiscutabil produsul predominant al transcriptiei, constituind 80-90% din masa totala de ARN celular atat la procariote cat si la eucariote. Exista mai multe molecule de ARNt, dar cu siguranta ca acestea sunt mai mici decat ARNs ribozomal. Atat ARNr cat si ARNt sunt reprezentati de catre gene multiple. In tabelul 24.5 sunt trecuti membrii prezenti intr-o serie de genoame.

Numarul genelor pentru ARNr major variaza de la 7 la E. coli, la 100-200 pentru eucariotele inferioare, la mai multe sute in cazul eucariotelor superioare. Aproape in toate cazurile, genele pentru moleculele de ARNr ale subunitatii mari si a celei mici formeaza un tandem (singura exceptie a fost evidentiata la mitocondriile de la drojdii).

La bacterii si la unele eucariote inferioare, genele pentru ARN 5S fac parte din aceeasi unitate, astfel incat numarul total al genelor 5S este acelasi cu numarul genelor pentru ARNs ribozomal majo; la eucariotele acesta este transcris independent. La eucariotele superioare, genele pentru ARNr 5S sunt organizate separat in propriul lor cluster, numarul lor depasind pe cel al genelor pentru ARNr major.

Numarul exact al genelor pentru ARNt este dificil de determinat, deoarece structura secundara extinsa a moleculei creeaza dificultati tehnice reactiilor de hibridizare. Probabil ca numarul actual este sub-estimat.

Lipsa oricarei variatii detectabile in secventele moleculelor ARNr implica identitatea tuturor copiilor fiecarei gene, sau existenta unor diferente care sa se manifeste sub pragul de detectie pentru ARNr ( 1%). Un punct de interes major este acela privind mecanismele care sunt utilizate pentru a impiedica variatiile care ar putea sa apara la nivelul secventelor individuale.

La bacterii, perechile de gene multiple ARNr 16S-23S sunt dispersate. In majoritatea nucleilor de la eucariote, genele pentru ARNr sunt continute intr-un cluster sau clustere in tandem. Adesea aceste regiuni sunt numite ADNr (In unele cazuri, proportia de ADNr di ADN total, impreuna cu compozitia sa atipica in baze este destul de mare pentru a permite separarea directa a fractiilor). Un trasatura a clusterului in tandem este ca acesta genereaza o harta de restrictie circulara. asa cum putem vedea in figura 24.10.

Presupunem ca fiecare unitate repetitiva are 3 situsuri de restrictie. In exemplul din figura 24.10, fragmentele A si B sunt in intregime continute intr-o unitate repetitiva, si fragmentul C contine capatul unei unitati repetitive si inceputul urmatoarei. Cand cartografiem aceste fragmente prin metode conventionale, gasim ca A ii urmeaza lui B, B ii urmeaza lui C, care ii urmeaza lui A, generand o harta circulara. Daca clusterul este mare, fragmentele interne (A, B, C) vor fi prezente in cantitati mult mai mari decat fragmentele terminale (X, Y) care conecteaza clusterul la regiunea de ADN adiacenta. Intr-un cluster cu 100 de repetitii, X si Y vor fi prezente la un nivel de 1% din nivelul lui A, B, C. Acest lucru face dificila obtinerea capetelor unui cluster de gene in scopul construirii unei harti.

Regiunea nucleului unde are loc sinteza ARNr prezinta o caracteristica aparte; este o regiune 'core' (miez) de natura fibrilara inconjurata de un cortex granular. Miezul fibrilar reprezinta regiunea in care ARNr este transcris de pe matrita ADN; cortexul granular este format din ribonucleoparticulele in care este asamblat ARNr. Intreaga suprafata este numita nucleol. Caracteristicile sale morfologice sunt prezentate in figura 24.11.

Regiunile particulare ale cromozomului asociate nucleolului se numesc organizatori nucleolari. Fiecare organizator nucleolar corespunde unui cluster de gene ARNr repetitive in tandem situate un cromozom. Nucleolii au o morfologie caracteristica datorita concentratiei mari a genelor repetitive in tandem si a intensitatii lor de transcriere.

Perechea de sARNr este transcrisa ca un singur precursor atat la bacterii cat si in nucleii eucariotelor. Dupa transcriptie, precursorul este clivat pentru a elibera moleculele individuale de ARNr. Modul de organizare a genei este prezentat in figura 24.12. Transcriptul incepe la capatul 5' 'leader', este urmat de secventa pentru ARNr mic, apoi de o regiune numita 'transcribed spacer' ('spacer transcris'), si in final de secventa moleculei de ARNr mare care este orientata catre capatul 3' al moleculei. ('Spacerul transcris' nu trebuie confundat cu 'nontranscribed spacer' care separa unitatile de transcriptie. Numele sau reflecta faptul ca acesta este parte a unitatii de transcriptie, dar nu este reprezentat in produsii maturi ARN).

Unitatea de transcriptie este mai lunga decat lungimea totala a moleculelor de sARNr. In tabelul 24.6 sunt prezentate cateva exemple ale relatiei dintre transcriptul primar si moleculele de sARNr.

Unitatea transcriptionala este mai scurta la bacterii, unde secventele ARNr constituie 80% din lungimea totala de 6 kb. Nu se observa nici o caracteristica sistematica la nivelul eucariotelor la care lungimea transcriptului variaza de la 7 la 8 kb, 70-80% din secventa reprezentand sARNr. Precursorul este mai lung la mamifere (unde este cunoscut ca ARN 45S, in functie de viteza de sedimentare). Aici secventele ARNr matur ocupa numai un pic mai mult de 50% din transcriptul complet.

Ce se intampla cu regiunile ne-ribozomale ale precursorului ARN ? *leaderul' si regiunile 'spscer' transcrise sunt inlaturate in timpul maturarii ARNr. 'Spacerul' transcris contine cateva secvente scurte care sunt eliberate prin clivare. La ,amifere si amfibieni, o secventa scurta formeaza ARN 5,8S, o secventa scurta care se leaga in ribozom, prin legaturi de hidrogen, cu ARNr 28S. La bacterii, secventele ARNt sunt localizate in spacerul transcris si (adesea) de asemenea la capatul 3' al transcriptului primar. Restul 'spacerului transcris, si toate secventele 'leader' sunt probabil degradate in nucleotide.

Clusterul ADNr contine multe unitati de transcriptie, fiecare separata de urmatoarea printr-un 'spacer' ne-transcris. Alternanta unitatilor de transcriptie si a spacerului (separatorului) ne-transcris se poate observa direct la microscopul electronic. Exemplul prezentat in figura 24.13 este caracteristic tritonului N. viridescens, la care fiecare unitate de transcriptie este intens exprimata, astfel incat mai multe ARN polimaraze sunt angajate simultan in transcriptia unei unitati repetitive. Polimerazele sunt atat de aproape lecalizate incat alungire produsilor lor formeaza o matruita caracteristica care se deplaseaza de-a lungul unitatii de transcriptie. Separatorul netranscris variaza destul de mult ca lungime (uneori) chiar in interiorul aceleiasi specii. In tabelul 24.7 sunt prezentate valorile unitatilor repetitive in tandem ale clusterelor ADNr.

La drojdii exista un separator netranscris scurt, relativ constant ca lungime. La D. melanogaster, exista variatii mari ale lungimii separatorului netranscris prezent intre diferite copii ale unitatii repetitive. O situatie similara este caracteristica X. laevis. In fiecare dintre aceste cazuri, toate unitatile repetitive sunt prezente sub forma unui singur cluster in tandem pozitionat pe un anumit cromozom . (in cazul D. melanogaster acesta este cromozomul sexual. Clusterul de pe cromozomul X este mai mare decat cel de pe cromozomul Y, astfel incat femelele poseda mai multe copii ale genelor ARNr decat masculii-Tabel 24.5)

La mamifere unitatea repetitiva este foarte mare, cuprinzand unitatea de transcriptie de 15 kb si un separator netranscris de 30 kb. In mod normal, genele sunt localizate in mai multe clustere dispersate-in cazul omului si a soarecelui este vorba de cinci si sase cromozomi.

O intrebare interesanta: cum reusesc mecanismele de corectie, care se presupune ca functioneaza in interiorul unui singur cluster pentru a asigura o secventa ARN constanta, sa se manifeste si in cazul existentei mai multor clustere ?

Variatiile lungimii separatorului netranscris intr-un singue cluster contasteaza cu ideea conservarii unei unitati de transcriptie. In ciuda acestei variatii, secventele separatorilor n etranscrisi mai lungi raman omologe cu cele ale separatorilor netranscrisi mai scurti. Aceasta implica ca fiecare separator ne-transcris prezinta repetitii interne, astfel incat variatiile de lungime sunt rezultatul modificarilor numarului de repetitii ale unora dintre subunitati.

Natura generala a separatorului ne-transcris este ilustrata cu ajutorul exemplului de la X. laevis. In figura 24.17 este ilustrata situatia. Regiunile care sunt fixe ca lungime alterneaza cu regiunile care variaza. Fiecare dintre cele trei regiuni repetitive cuprind un nunar variabil de repetitii ale unei secvente scurte. Un tip de regiune repetitiva este cea care contine unitati repetitive de 97 pb; cealalta care are doua localizari, are o unitate repetitiva in doua forme (din doua componente). de 60 pb si respectiv 81 pb. Variatia numarului de unitati repetitive la nivelul regiunilor repetitive influenteaza variatia lungimii totale a separatorului.

Una dintre regiunile fixe (de la inceputul unitatii) este unica ca lungime si secventa. Celelalte sunt secvente scurte constante numite insule Bam. (Aceasta regiune are acest nume datorita enzimei de restrictie cu ajutorul careia a fost izolata). Din acest tip de organizare, se poate observa evolutia clusterului prin duplicari in care a fost implicata regiunea promotor.

Separatorul ne-transcris are rol in transcriptie. Repetitiile 60/81 pb au rol de initiere, probabil comparabil cu rolul pe care activatorii il au pentru genele transcrise de catre ARN polimeraza II. Prezenta unui separator creste frecventa de initiere, aparent prin faptul ca determina mai multe ARN polimeraze I sa se lege succesiv la promotor. Nu putem inca intelege natura exacta a acestei relatii, si cat de mult depinde ea de similitudinile de secventa dintre separator ti promotor.

Organizarea clusterului genelor histonelor la diferite organisme

Genele pentru histone: conservarea secventei codante si divergenta la nivelul

organizarii genei

Proprietatile generale ale genelor pentru histone

Structurile primare ale histonelor sunt bine conservate, chiar si la eucariote foarte diferite. Acest lucru nu este surprinzator, dat fiind rolul fundamental si comun pe care histonele il au in strutura cromatinei. Totusi, histonele variaza. Secventele histonelor H1 sunt cele care poseda cel mai mare grad de divergenta, cele ale H3 si H4 fiind cele mai putin divergente. Pentru o anumita specie, in diferite etape de dezvoltare sau ale ciclului celular sau in tesuturi diferite pot fi sintetizate molecule de histone usor diferite. De exemplu, expresia majoritatii genelor pentru histone in faza S a ciclului celular si deci in timpul replicarii. Alte gene, numite gene de inlocuire, se exprima intr-o proportie redusa in timpul intregului ciclu celular. In contrast cu conservarea secventelor polipeptidice, numarul de aranjamente ale genelor pentru histone difera considerabil intre specii (figura 9.18 pag 657, G&G). Aceasta subliniaza, cum o face de altfel si organizarea genelor pentru ARNt, ca pastrarea (conservarea) secventelor codante nu presupune neaparat conservarea numarului de copii sau a organizarii genomice.

Genele diferitelor familii de histone au tendinta de a fi legate (unitate de linkage) dar contrar genelor pentru ARNr, unde trei gene sunt prezente intr-o singura unitate de transcriptie, fiecare gena pentru histone este transcrisa ca o unitate separata, adesea chiar de pe o catena opusa. O alta diferenta fata de genele pentru ARNr este ca ordinea genelor pentru histone nu este neaparat aceeasi de la o specie la alta si nici chiar in aceeasi specie. In plus, cu toate ca genele 'legate' pentru histone sunt repetitive in anumite organisme, ele sunt dispersate la pasari si mamifere.Cea mai mare parte a genelor pentru histonele de tip replicativ (care sunt exprimate in faza replicarii ADN) sunt lipsite de introni iar moleculele de ARNm nu poseda coada poliA.

Pentru obtinerea de informatii privind organizarea genelor pentru histone inainte de aparitia tehnicilor ADN recombinat au fost folosite doua abordari experimentale. In primul rand, separarea genelor pentru histone la nivelul benzilor satelitilor dupa centrifugarea ADN total in gradient de densitate a dus la evidentierii numarului de copii si a organizarii in tandem la ariciul de mare. Apoi a fost posibila purificarea partiala a ARNmpentru histone pornind de la o sursa imbogatita.

Clonarea genelor pentru histone

In primele zece ore dupa zecundare, oualele de arici de mare se divid de 2x109 la 2x1010 ori. Aceste diviziuni celulare sunt insotite de o replicare rapida a ADN si de o sinteza importanta de histone. In timpul acestei perioade, 30% dintre proteinele sintetizate sunt proteine nucleare iar moleculele de ARNm care codifica pentru histone sunt foarte abundente. Marimea lor caracteristica face ca acestea sa se concentreze in fractia de ARNm care sedimenteaza la 9S. Prin electroforeza in gel de poliacrilamida se pot separa moleculele de ARNm pentru histonele individuale care pot fi apoi identificate prin traducere in vitro. Moleculele de ARNm de arici de mare au putur fi astfel folosite drept sonde pentru clonarea genelor de histone de la plante, ciuperci si animale.

La ariciul de mare genele pentru histone sunt un grup particular de gene care asigura sinteza rapida a histonelor in timpul stadiilor embrionare foarte precoce. Dupa formarea stadiului de blastula, are loc stimularea unui alt grup de gene care este responsabil de sinteza histonelor in timpul urmatoarei perioade de dezvoltare si la oeganismul adult. Aceste doua grupe sunt denumite ca grupul de 'gene precoce' si grupul de 'gene tardive' de la ariciul de mare. Organizarea lor variaza de la o specie de arici de mare la alta. In continuare vom exemplifica cu situatia genelor de la Strongylocentrotus purpuratus.

Segmentele genomice care contin genele histonelor precoce au fost clonate plecand de la o banca de fragmente de ADN obtinute prin digestie cu EcoRI si folosind drept sonda ARNm total de histone (figura 9.19 pag 658, G&G). Au fost obtinute doua fragmente care nu se hibridizeaza intre ele Totusi, prin cartografie genomica s-a constat ca aceste doua fragmente sunt 'legate' (linkate) intr-un interval de 7 kb in genom.Prezenta si ordinea celor cinci gene pentru histone in cele doua clone, a fost stabilita prin hibridizarea ADN-ului lor cu ARNm separat prin electroforeza. Heteroduplexurile formate au fost analizate prin microscopie electronica.

De asemenea, fiecare molecula de ARNm a fost testata prin hibridizare cu catenele separate ale segmentelor clonate; moleculele de ARNm se hibridizeaza toate pe aceeasi fibra, ceea ce demonstreaza ca cele cionci gene sunt transcrise in acelasi sens. In continuare, analiza secventei nucleotidice a confirmat toate concluziile si a stabilit marimea exacta a regiunilor codante si a separatorilor dintre acestea. Cele cateva sute de exemplare 'linkate' de gene pentru histone precoce sunt formeaza lungi alinieri in tandem. Aranjamente comparabile se regasesc la mai multe specii de arici de mare.

Genele histonelor 'tardive' nu sunt repetate decat de aproximativ 10 ori, situatia fiind diferita de cea a genelor precoce. In afara de numarul lor redus de copii, genele 'tardive' se diferentiaza de cele 'precoce' din multe ale puncte de vedere. In primul rand, ele nu sunt 'linkate' in grupe de cinci si nici organizate in repetitii in tandem. Anumite gene sunt vecine (de exemplu, H3 si H4) situate la 1 kb una de alta, in timp ce altele sunt mult mai 'izolate', separate prin cel putin 6 kb de orice alte gene pentru histone. Nici ordinea genelor, nici sensul de transcriere al acestora nu sunt corelate cu aranjamentul genelor precoce echivalente. In plus, organizarea genelor 'tardive' este variabila de la o specie la alta de arici de mare.

Genele histonelor 'precoce' si 'tardive' clonate corespunzatoare nu se hibridizeaza intre ele in conditii stricte de hibridizare cu toate ca produsii genelor au structuri foarte asemanatoare (uneori chiar identice). Diferentele dintre secventele codante reflecta folosirea unor codoni diferiti pentru acelasi aminoacid. Secventele care flancheaza genele 'precoce' si 'tardive' corespunzatoare sunt si mai divergente, cu exceptia secventelor nucleotidice esentiale necesare transcrierii de catre ARN polimeraza II.

Genele pentru histone la alte specii. La Drosophila, hibridizarea in situ a genelor clonate cu cromozomii politeni, a permis localizarea tuturor genelor pentru histone intr-o regiune a cromozomului 2. Cele 5 gene sunt 'legate' in cadrul uneu unitati repetitive de aproximativ 100 de ori; ordinea si sensul de transcriptie a genelor sunt total diferite de cele ale genelor de la ariciul de mare (figura 9.18 pag 657, G&G). Trecerea de la o sinteza ridicata de histone la cantitati scazute in timpul embriogenezei la Drosophila nu se bazeaza aparent pe expresia unor gene difeite, ca la arici, ci este rezultatul modularii expresiei aceluiasi grup de gene.

ADN de la drojdii (S. cerevisiae) contine doua copii ale unui segment care contine o gena pentru H2A si o gena pentru H2B, si doua copii ale unui alt segment care contine o gena pentru H3 si una pentru H4 (figura 9.18). Genele omologe in perechile de segmente pot codifica pentru proteine putin diferite (de exe pentru H2A) sau identice (ex. H3). Nu se stie daca aceste vaeriatii prezinta semnificatie functionala.

Ca si la nevertebrate, vertebratele prezinta o diversitate foarte mare a organizarii genelor pentru histone (figura 9.18). La Xenopus, exista mai multe grupe de gene'legate' pentru cele cinci histone, dar genele sunt ordonate diferit, Doua dintre grupe se disting prin variatii ale genei H1. Fiecare dintre aceste gene H1 se hibridizeaza cu molecule ARNm diferite din ovocit, si cei doi mesageri produc, prin traducere in vitro, proteine H1 diferite. De asemenea, genomul de Xenopus contine mai multe aliniamente in tandem ale grupelor de gene pentru histone, dar contrar genelor precoge pentru histone de la arici, grupele vecine din interiorul aceleiasi alinieriprezinta polimorfism de restrictie.

Localizarea celor aproximativ 700 de gene pentru histone de la Triton demonstreaza ca pozitia genelor are importanta scazuta pentru anumite aspecte ale expresiei acestora. Segmentele de ADN care contin genele celor cinci histone au o lungime de 9 kpb si fiecare este situat intr-o lunga serie de repetitii in tandem ale unei secvente ne-inrudite situata pe acelasi brat al cromozomului. Se pot observa intre 50 la 100 kpb di aceasta secventa repetitiva in tandem intre fiecare grupa de gene pentru histone. Aceeasi secventa repetitiva in tandem apare si la nivelul centromerilor.

Animalele cu sange cald au relativ putine gene pentru histone. Acestea nu sunt nici grupate sistematic si nici repetate in tandem, dar se pot evidentia adesea gene vecine

Doua mecanisme posibile pentru mentinerea omogenitatii unei familii multigenice in tandem

O dilema evolutiva: Cum pot fi mentinute mai multe copii active

Aceeasi problema se pune si atunci cand gena a fost duplicata. Cum poate selectia sa previna acumularea de mutatii modificatoare ?

Duplicarea unei gene are ca rezultat o relaxare imediata a presiunii evolutive asupra secventei sale. Acum exista doua copii identice, modificarea secventei uneia nu va lipsi organismul de o proteina functionala, atata timp cat secventa originala in aminoacizi continua sa fie codificata de o alta copie. Astfel presiunea selectiva asupra celor doua gene este difuzata, pana cand una dintre ele achizitioneaza un numar suficient de mutatii ti se inmdeparteaza destul de mult de functia sa originala incat toata presiunea selectiva sa se reflecte asupra celeilalte.

Imediat dupa o duplicare genica, modificarile se pot acumula mult mai rapid intr-una din copii, conducand eventual la o functie noua (sau la modificarea genei sub forma unei pseudogene). Daca se dezvolta o noua functie, gena va evolua cu aceiasi viteza scazuta ca si functia sa originala. Probabil acesta este tipul de mecanism responsabil de separarea functiilor genelor embrionare si adulte ale globinei.

Exista si situatii in care genele duplicate raman cu aceeasi functie, codificand pentru proteine identice sau aproape identice. Genele a-globinei umane codifica proteine identice, iar intre cele doua proteine si g-globina exista numai un singur aminoacid diferit. Cum se exercita presiunea selectiva pentru a mentine secvente identice ?

Au fost propuse doua tipuri generale de mecanisme. Ele se bazeaza pe principiul ca genele nealelice nu sunt mostenite independent, dar trebuie regenerate continuu dupa una dintre copiile generatiei anterioare. In cazul cel mai simplu a doua gene identice, cand o mutatie apare in una dintre copii, fie este eliminata din intamplare (deoarece secventa altor copii este eliminata), fie aceasta este extinsa la cele doua replici (gene duplicate) (deoarece copia mutanta devine versiunea dominanta). Aceasta extindere expune mutatia selectiei. Rezultatul este ca cele doua gene evolueaza impreuna. Acest fenomen se numeste evolutie concertata (coincdenta) (coevolutie ocazionala). Ea este aplicabila unei perechi de gene identice sau unui cluster care contine multe gene.

Unul dintre mecanisme presupune ca secventele genelor ne-alelice sunt comparate direct una cu cealalta sui omogenizate de enzime care recunosc orice diferenta. Acest lucru poate fi realizat prin schimbarea monocatenelor intre ele, pentru a forma gene ale caror catene deriva dintr-o copie si cealata dintr-o alta copie. Orice diferenta care apare intre secvente si care determina o imperechere necorespunzatoare, poate atrage atentia unor enzime capabile sa inlature si sa inlocuiasca o baza, astfel incat numai imperecherile A-T si G-C sa fie viabile. Acest tip de eveniment este numit conversie genica si este asociat cu procesele de recombinare genetica.

Apare necesitatea certificari (stabilirii) scopului unor astfel de evenimente prin compararea secventelor genelor duplicate. Daca ele sunt subiectul unei evolutii concertate, nu trebuie sa constatam acumularea unor substitutii la nivelul situsurilor silentioase ale acestora (deoarece procesul de omogenizare se aplica si acestora la fel de bine casi in cazul situsurilor de substitutie). Se stie ca extinderea mecanismului de mentinere nu se extinde dincolo de gena insasi, astfel incat cazuri de gene duplicate ale caror secvente flankante sunt total diferite. Intradevar, se poate constata existenta unoe catete 'abrupte' care marcheaza capetele secve ntelor care au fost omogenizate.

Trebuie sa ne reamintim ca existenta unui astfel de mecanism poate invalida povestea (determinarea) istoriei unor astfel de gene prin intermediul divergentei lor, deoarece divergenta reflecta numai timpul de la ultimul eveniment de omogenizare/regenerare, si nu duplicarea originala.

Cand exista mai multe copii ale genei, efectele imediate al mutatiei pentru orice copie trebuie sa fie foarte usor. De exemplu, in cazul clusterului ADNr, exista sute de copii de gene, aproape toate identice. Cosecintele unei mutatii individuale sunt diluate de numarul mare de copii ale genei care pastreaza secventa salbateca. Aceasta sugereaza ca o proportie apreciabila de copii muante se pot acumula inainte ca efectuul sa devina destul de puternic pentru a fi eliminate de catre evolutie.

Letalitatea devine cantitativa, concluzie sustinuta de observatia ca se poate realiza inlaturarea a jumatate dintre unitatile clusterului ADNr de la X. laevis si D. melanogaster fara nici un efect. Deci cum se realizeaza prevenirea acumularii unor mutatii modificatoare ? Ce sansa au mutatiile favorabile sa isi demonstreze avantajele in cadrul unui cluster ?

Concluzia inevitabila este ca anumite mecanisme trebuie sa permita anumitor variante sa fie analizate de catre evolutie (sa fie cantarite in procesul evolutiv). Si in acest caz au fost propuse doua tipuri de mecanisme.

Modelul corectarii neasteptate (sudden corection) presupune ca destul de frecvent un cluster de gene este inlocuit de un nou set de copii derivat din una sau din mai multe copii prezente in generatia anterioara. Pentru a se putea realiza (impune) o forta selectiva, 'destul de frecvent ('every so often') trebuie sa fie de cateva generatii (trebuie sa reprezinte cateva generatii); dar in termeni practici, orice mecanism trebuie sa fie structurat pe baze periodice regulate, ceea ce inseamna la fiecare generatie.

Numarul mic de copii care dau nastere unui nou cluster formeaza un set 'master' asupra caruia actioneaza selectia; copiile inlaturate sunt irelevante pentru selectie. Copiile 'master' pot constitui un set particular care poate fi ales la intamplare. Mecanismul se poate presupune ca este asemanator celui de amplificare, sau de conversie pozitiva a genelor.

Dificultatea acestui model este ca el presupune regenerarea unui cluster din cateva unitati repetitive. Aceasta inseamna ca atat unitatile de transcriptie cat ti separatorii trebuie regenerati, astfel incat intreaga unitate repetitiva sa fie omogena ca secventa (sau cel putin, sa nu aiba o variabilitate mai mare decat numarul mic de copii master). Dar de fapr separatorii manifesta o variabilitate continua, in timp ce numai unitatile de transcriptie sunt constante.

Celalalt model, crossover fixation, presupune ca intregul cluster este supus unui mecanism de rearanjare continua prin crossing-over inegal. In esenta, este vorba de aplicarea la nivelul unui cluster in tandem a mecanismului deja discutat pentru genele globinei pe baze mult mai restrictive si ocazionale. Astfel de evenimente pot explica evolutia concertata a genelor multiple daca prin intermediul unui crossing-over se poate determina regenerarea fizica pornind de la o copie.

Urmand mecanismul descris in figura 24.4, de exemplu, cromozomul care poarta un locus triplu poate suferi deletia uneia dintre gene. Din cele doua gene ramase, 11/2 reprezinta secventa uneia din copiile originale si numai 1/ secventa celellalte copii originale. Orice mutatie existenta in prima regiune va exista acum in ambele gene si va fi subiectul presiunii selective.

Analizind consecintele crossing-overului inegal este evident ca clusterele in tandem furnizeaza sanse frecvente pentru 'imperecherea neadecvata' a genelor ale caror secvente sut aproximativ aceleasi, dar care sunt situate in diferite pozitii ale clusterului. Prin expansiune continua si contractare a numarului de unitati prin crossing-over inegal, este posibil ca toate unitatile sa derive dintr-o regiune mica a unui cluster ancestral. Lungimea variabila a separatorilor este concordanta cu ideea ca crossing-overul inegal care loc cu implicarea unor separatori intre care se realizeaza a imperechere inadecvata interna. Aceasta poate explica omogenitatea genelor comparativ cu variabilitatea separatorilor.Genele sunt supuse selectiei cand unitatile repetitive individuale sunt amplificate in interiorul unui cluster; dar separatorii sunt irelevanti si pot acumula modificari.

Evolutia sintezei genelor globinei in dezvoltarea embrionara si fetala

Gene esentiale si numarul total al genelor

Cate gene sunt esentiale ? O alta abordare a chestiunii numarului de gene este sa determinam numarul genelor esentiale prin analize mutationale. Daca se realizeaza saturarea unor regiuni specifice de pe cromozom cu mutatii care sunt letale, numarul grupurilor de complementare in care aceste mutatii sunt distribuite va identifica numarul total de 'loci' letali din acea regiune. Prin extrapolare la intregul genom, putem calcula numarul total de gene esentiale.

Cele mai extinse analize asupra numarului esential de gene au fost realizate la Drosophila unde s-a putut realiza corelarea aspectului vizibil al cromozomilor cu numarul de unitati genetice. Acest lucru a fost posibil prin urmarirea prezentei benzilor la nivelul cromozomilor politeni de la D. melanogaster. (Acesti cromozomi pot fi evidentiati in anumite stadii de dezvoltare si reprezinta o forma fizica neobisnuit de extinsa, in care se pot vedea serii de benzi , denumite mai mult formal cromomere). Pornind de la conceptul initial ca benzile por reprezenta o ordine lineara a genelor, s-a ajuns la ideea corelarii organizarii genelor cu organizarea benzilor. Exista peste 5 000 de benzi in setul haploid de la D. melanogaster; acestea variaza adesea cu un ordin de marime, dar media este poate fi de aprox 20 kb per banda.

Abordarea de baza este de a satura o regiune cromozomala cu mutatii. De obicei mutatiile sunt colectate simplu ca letale, fara a analiza cauza letalitatii. Orice mutatie care este letala este luata in seama (in evidenta) pentru a identifica un locus care este esential pentru organism. Cand mutatiile sunt plasate intr-un grup de complementare, numarul acestora poate fi comparat cu numarul benzilor prezente in regiune, sau grupuri individuale de complementare pot fi alocate unor benzi individuale. Scopul acestor experiente este determinarea existentei unei corelatii consistente intre benzi si gene; de exemplu daca fiecare banda contine o singura gena ?

In figura 24.1 este prezentat un exemplu de regiune cartografiata, in care 12 grupuri de complementare au fost cartografiate intr-o regiune rosy de 16 benzi. In acest caz, grupul a fost cartografiat cu ajutorul unor markeri ADN de marime cunoscuta, astfel incat a fost posibila constatarea ca intreaga regiune contine 300 kb. Aceasta distributie a grupurilor de complementare este in general paralela cu distributia benzilor, dar nu se poate spune ca exista o corelatie de 1:1.

In tabelul 24. 1 sunt prezentate analizele realizate de-a lungul acestei linii care a fost evidentiata cu peste 25 de ani in urma. Se demonstreaza o corelatie rezonabila intre numarul de benzi (265) si numarul de grupuri de complementare (215). Aceasta corespunde la aproximativ 5% din genomul D. melanogaster. In cazurile in care grupurile au fost cartografiate folosind ADN, se constata existenta unei regiuni de 10-20 kb pentru un grup de complementare letala, distanta care este de doua ori mai mare decat marimea medie a unei gene.

Diferenta dintre numarul total de gene si numarul de gene letale adusa din nou in discutie datorita datelor genetice si biochimice. La nivel molecular, se cunoaste ca multe gene sunt localizate in aceeasi vecinatate, de exemplu, ele pot fi linkate pe aceleasi fragmente genomice. Aceasta inseamna ca astfel de gene sunt localizate in interiorul aceleiasi benzi. Aceasta este totusi un contrast intre echivalenta aparenta a locilor letali si a benzilor, si prezenta mai multor gene intr-o banda. Exista posibilitatea ca o banda sa contina mai multe gene, dar multe dintre acestea sau chiar toate sa nu fie gene esentiale. Pana in prezent nu putem spune ca exista posibilitati clare de definire a unor criterii dupa care sa se poata decide care sunt genele esentiale si care cele ne-esentiale.

Un experiment care a incercat sa determine ce proportie din genele actuale este esentiala s-a soldat cu rezultate foarte interesante in cazul S. cerevisiae. Genomul acestei drojdii este relativ mic, si o mare parte este transcris (>50% daca comparam cu eucariotele superioare). In urma introducerii unor insertii la intamplare in genom, s-a constatat ca numai 12% dintre acestea sunt letale, si alte 14% impiedica cresterea. Majoritatea insertiilor (70%) nu au avut nici un efect. Daca toate insertiile utilizate contineau semnale de terminare a transcriptiei ne puteam astepta ca acestea sa impiedice expresia oricarei gene in care se integrau.

In tabelul 24.3 sunt analizate aceste rezultate. Se presupune ca toate intreruperile care nu aveau nici un efect erau pozitionate in regiuni netranscrise. Proportia intreruperilor de acest tip poate fi de 50% astfel incat ramane o proportie de 20% din intreruperi fara efect cu toate ca sunt pozitionate in regiuni transcrise (Regiunile transcrise reprezinta 50% din genom dar reprezinta continutul tuturor genelor). In urma acestor rezultate se poate considera ca intreruperea a 20% din regiuni reprezinta intreruperea a 40% dintre gene. Aceasta implica ca 40% dintre genele exprimate la drojdii nu sunt esentiale.

Cum pot fi explicate aceste rezultate ? O posibilitate o reprezinta existenta unei redundante extinse, astfel incat multe gene sunt prezente in mai multe copii. Acest punct de vedere este cu siguranta adevarat pentru anumite cazuri, in care mai multe gene trebuie inactivate pentru a obtine un efect. Pentru moment nu avem la indemana nici o modalitate de control (supraveghere) sistematica cu ajutorul careia sa determinam cate dintre genele actuale poseda functii unice si cate sunt redundante sau pur si simplu organismul se poate dispensa de ele.

Ideea ca anumite gene nu sunt esentiale (sau cel putin ca nu pot fi evidentiate efecte serioase asupra fenotipului) ridica cateva intrebari importante. Contine genomul gene autentic dispensabile, sau au aceste gene actuale efect semnificativ asupra fenotipului cel putin in timpul lungului progres al evolutiei ? Are fiecare gena o functie unica (asa cum ne putem astepta daca este esentiala) sau exista redundanta: sunt prezente unele gene sub forma mai multor copii ?

Nu ne putem pronunta daca la eucariotele superioare exista functii de care celula sa se poata dispensa, dar daca exista, trebuiesc re-gandite unele din intrebarile asupra evolutiei. Stim ca unele gene par sa fie redundante. Exista multe cazuri in care mutatiile locilor individuali de la drojdii si Drosophila nu prezinta efecte aparente, dar in prezenta altor mutatii la nivelul altor loci devin letale. Intrebarea daca exista cu adevarat gene redundante este foarte dificila si ea la randul ei conduce la o alta intrebare dificila: cum se realizeaza presiunea selectiva pentru aceste gene ?

Alte intrebari cheie sunt: care este proportia de gene esentiale din numarul total de gene; ce numar de mutatii produce pana la urma efecte detectabile; exista gene care sunt autentic dispensabile ? Daca acesta este cazul in care se gasesc multe gene si anume de a nu codifica pentru proteine specifice care nu sunt esentiale pentru supravietuirea organismului (in sensul in care modificari mutationale nu determina nici un efect detectabil), trebuie sa raspundem de ce aceste continua sa fie exprimate. Alte intrebari secundare despre genom ca intreg sunt: are ADN vreo functie (daca exista vreuna) care nu este codificata de gene (care nu rezida in structura genelor) ? Ce efect are o modificare importanta (este cazul amfibienilor) a marimii totale asupra operabilitatii genomului ?

Organizarea structurala a diferitelor gene pentru globine

Genele globinei sunt organizate in doua clustere

Exemplul cel mai bine caracterizat pentru un cluster de gene este reprezentat de genele globinei, care constituie o familie veche, si responsabile de o functie cu rol central in lumea animala: transportul oxigenului de catre sange. Constituentul major al celulelor rosii ale sangelui este tetramerul de globina, asociat cu gruparea hem (ion binding -care leaga fierul) pentru a forma hemoglobina. Genele functionale ale globinei de la toate speciile au aceeasi structura, fiind impartite in trei exoni asa cum s-a vazut mai inainte in figurile 23.4 si 23.21. Putem concluziona ca toate genele globinei deriva dintr-o singura gena ancestrala; astfel incat trasand (urmarind) dezvoltarea (evolutia) genelor individuale in interiorul unei specii si intre acestea, putem intelege (invata) despre mecanismele implicate in evolutia familiilor de gene.

In celulele adulte, tetramerul de globina consta in doua lanturi a si doua b identice. Genele a si b sunt pozitionate la nivelul unor loci genetici diferiti a caror exprimare trebuie coordonata pentru a asigura o sinteza echivalenta a ambelor polipeptide. Acest sistem furnizeaza in consecinta un exemplu de control simultan a unor gene dispersate pentru a genera un anumit fenotip celular.

Celulele rosii embrionare contin tetrameri de hemoglobina care sunt diferiti de formele adulte. Fiecare tetramer contine doua catene asemanatoare lanturilor a si doua lanturi identice cu b, fiecare dintre acestea fiind inrudite cu polipeptidul caracteristic adultului fiind mai tarziu inlocuit de acesta. Acesta este un exemplu de control al dezvoltarii, in care diferite gene sunt supuse procesului de 'switched on and off' (de schimbare a directiei/orientarii) pentru a furniza produsi alternativi care indeplinesc aceeasi functie in diferite etape de timp.

Detaliile asupra relatiilor dintre hemogobinele adulte si embrionare variaza in functie de organism. Etapele urmate la om constau in trei stadii: embrionar, fetal, si adult. Distinctia dintre embrionar si adult este comuna la mamifere, dar numarul de stadii pre-adulte variaza. La om catenele zeta si alfa sunt cele doua lanturi asemanatoare cu a (like a), si bata sunt chiar lanturile b obisnuite. Catenele exprimate in diferite stadii de dezvoltare sunt prezentate in tabelul 24.4.

z (zeta) este prima catena like-a exprimata, dar este foarte repede inlocuita de catre adevarata catena a. La nivelul cai sintezei lanturilor de tip b, sunt exprimate mai intai catenele e (epsilon) si g (gama), fiind inlocuite cu d (delta) si b (beta) mai tarziu. La adulti, formele a b2 constituie 97% din totalul structurii hemoglobinei, a d2 aproximativ 2%, si 1% este reprezentat de persistenta formei de la fetus a g

Divizarea lanturilor globinei in lanturi like-a si like-b reflecta organizarea genelor intr-un singur cluster. Structurile celor doua clustere prezente la primatele superioare sunt prezentate in figura 24.2.

Intr-o regiune de peste 50 kb, clusterul b contine cinci gene diferite (e, doua g d si b) si o pseudogena (bY). Cele doua gene g difera in secventa codanta prin numai doi aminoacizi; varianta G poseda o glicina in pozitia 136 unde varianta A are o alanina.

Tabel 24.4. Hemoglobinele umane se modifica in cursul dezvoltarii

Stadiu de dezvoltare Hemoglobine

Embrionar (< 8 saptamani) z e z g a e

Fetal (3-9 luni) a g

Adult (dupa nastere) a d a b

Clusterul a este mult mai compact si include intr-o regiune de peste 28 kb, o gena activa z (zeta), o pseudogena z (zeta), doua gene a, doua pseudogene am si o gena q (teta) a carei functie nu este cunoscuta. Cele doua gene a codifica pentru aceeasi proteina. Doua sau (mai multe) gene identice prezente pe acelasi cromozom sunt considerate copii ne-alelice.

Genele functionale sunt definite prin expresia lor in ARN, si pana la urma prin proteinele pe care le codifica. Pseudogenele sunt denumite astfel datorita incapacitatii lor de a codifica proteine; motivatia inactivitatii variaza iar deficientele pot fi la nivel transcriptional sau translational (sau la ambele). Cateodata )din cand in cand) una dintre gene nu poate fi plasata in nici una din clase. De exemplu structura genei q a fost descoperita la unul dintre capete dupa ce s-a considerat ca structura clusterului a era bine definita. Nu a fost nici o problema ca aceasta sa fie clasificata ca o pseudogena, atata timp cat nu a fost posibila identificarea unui produs de reactie. De asemenea rolul sau ramane neclar.

O organizare similara a fost gasita pentru clusterele genelor globinei de la alte vertebrate, dar detalii ca tipul, numarul si ordinea genelor pot varia. in pozitia in care la o specie este localizata o pseudogena la alta specie poate fi localizata o gena activa; de exemplu, pseudogena by de la primatele superioare este localizata intr-o pozitie echivalenta cu o gena embrionara activa de la capra. Cateva exemple de clustere ale b globinelor sunt prezentate in figura 24.3.

Caracterizarea acestor clustere de gene marcheaza un punct general foarte important. Pot exista mai multi membri ai unei familii de gene atat functionali cat si ne-functionali, pe care ii putem suspecta pe baza analizelor proteinelor. Genele extra-functionale pot reprezenta duplicate care codifica pentru polipeptide identice; sau ele pot fi inrudite cu proteine cunoscute, cu toate ca sunt diferite de ele (si care se presupune ca sunt exprimate numai o perioada scurta de timp si in cantitati mici). Tinand cont de toate aceste trasaturi, este greu sa fim siguri ca toti membrii unui cluster au fost identificati si ca regiunile care flancheaza clusterul reprezinta ultimii membri ai acestuia.

Cu privire la intrebarea cat de mult ADN este necesar pentru a codifica o anumita functie, constatam ca pentru regiunea care codifica pentru catene like-b la mamifere sunt necesare intre 20-50 kb. Aceasta regiune este mult mai mare decat ne-am fi asteptat analizand proteinele b-globine cunoscute sau luand in considerare genele individuale. Regiunea clusterului b, pare sa codifice numai pentru b-globine, dar cu cat sunt descoperite mai multe gene sau clustere de gene care codifica pentru proteine particulare, cu atat mai mult nu se va putea identifica rapid tipul de aranjament caracteristic.

Crossing-overul inegal re-aranjeaza clusterele de gene

Pentru rearanjarea unui cluster care contine gene identice sau inrudite exista diferite oportunitati. Putem vedea rezultatele obtinute prin compararea clusterele b de la mamifere prezentate in figurile 24.2 si 24.3. Chiar daca clusterele codifica pentru aceeasi functie, si toate poseda aceeasi organizare generala, fiecare este diferit ca marime, exista variatii ale numarului total si a tipurilor de gene care codifica pentru b-globine, si este diferit numarul si structura pseudogenelor. Toate acest modificari au aparut de cand a avut loc marea radiatie a mamiferelor, acum 58 milioane de ani in urma (ultimul punct al evolutiei comun tuturor mamiferelor).

Comparatiile demonstreaza ca procese generale cum sunt duplicarea genelor, rearanjarea, si variatia, reprezinta factori la fel de importanti in evolutie ca si acumularea lenta a mutatiilor punctiforme in genele individuale. Ce tipuri de mecanisme sunt responsabile de reorganizarea genelor ?

Un cluster de gene se poate mari sau contracta prin crossing-over inegal, cand recombinarea apare intre gene ne-alelice, asa cum se poate vedea in figura 24.4. In mod normal, recombinarea implica secvente corespunzatoare de ADN aliniate exact intre doi cromozomi omologi. Totusi, cand exista doua copii ale aceleiasi gene pe fiecare cromozom, o este posibil ca o aliniere ocazionala sa permita imperecherea acestora . (Aceasta implica ca regiunile adiacente raman neimperechiate).

Cand evenimentul de recombinare apare intre copii nepotrivite ale genelor, se genereaza cromozomi recombinati ne-reciproci (nonreciprocal recombinant chromosomes), unul dintre acestia avand o duplicare a genei iar celalalt o deletie. Primul recombinat are astfel o crestere a numarului de copii ale genei de la 2 la 3, in timp ce al doilea descreste de la 2 la 1.

In acest exemplu, noi am considerat copiile genelor ne-echivalente 1 si 2 ca fiind in intregime omologe. Totusi, crossing-overul inegal poate sa apara si cand genele adiacente prezinta un grad ridicat de inrudire (desi probabilitatea este mai mica decat in cazul genelor identice).

O problema a crossing-overului inegal este reprezentata de intreruperea structurii genelor. Intr-un caz ca al globinelor, exonii corespunzatori copiilor genelor adiacente se pare ca sunt destul de inrudite pentru a se imperechia; dar secventele intronilor prezinta o divergenta apreciabila. Reducerea imperecherii numai la exoni reduce considerabil continuitatea lungimii ADN care poate fi implicat. Aceasta inseamna ca exista sanse mai mici sa se produca un eveniment de crossing-over inegal. Aceasta divergenta a intronilor (dintre introni) poate determina (controla) o stabilitate a clusterelor de gene prin impiedicarea (potentarea) aparitiei crossing-overului inegal.

Talasemiile sunt rezultatul mutatiilor care reduc sau impiedica sinteza lanturilor a sau b. Incidenta crossing-overului inegal la nivelul clusterelor genelor globinei este evidentiata prin natura anumitor talasemii.

Multe din cele mai severe talasemii sunt rezultatul deletiilor unei parti a clusterului. Cel putin in unele cazuri, capetele deletiei sunt pozitionate in regiuni omologe, deletiile fiind exact asa cum ne asteptam generate prin crossing-over inegal.

In cazul a-talasemiilor au fost determinate doua tipuri de deletii. Deletia a-thal-1 elimina ambele gene a. Numele se refera la cromozomul individual care poarta deletia. In functie de combinatia diploida a cromozomilor talasemici (purtatoare de modificari care genereaza talasemia), un individ afectat poate avea orice numar de lanturi a cuprins intre zero si trei. Indivizii cu doua sau trei gene a manifesta putine modificari (diferente) fata de tipul salbatec (patru gene a). In cazul celor cu o singura gena a se formeaza tetramerul anormal b4, care determina maladia HbH. Absenta completa a genelor a determina aparitia 'hydrops fetalis' (hidropsie fetala), care este fatala inainte de nastere.

In figura 24. 5 sunt prezentate deletiile care pot cauza a-talasemii. Deletiile a-thal-1 sunt lungi, variaza ca localizare la capatul stang, pozitiile capetelor din dreapta fiind localizate intre gene cunoscute. Deletiile a-thal 2 sunt scurte. In cazul formei L sunt eliminate 4,2 kb din ADN, care includ gena a2. Acesta este probabil rezultatul unui crossing-over inegal, deoarece capetele deletiei sunt localizate in regiuni omologe, chiar la dreapta genelor ay si respectiv a2. Forma R rezulta prin indepartarea a 3,7 kb din ADN, distanta exacta dintre genele a1 si a2. Se pare ca aceasta este si ea generata prin crossing-over inegal intre genele a1 si a2. Aceasta situatie exacta este prezentata in figura 24.4.

In acelasi crossing-over inegal in urma caruia sunt generati cromozomii talasemici se obtine si un cromozom care poseda trei gene a Indivizi cu astfel de cromozomi au fost identifici in numeroase populatii. In unele populatii, frecventa locusului a triplu este aproape aceeasi ca a celor cu un singur locus a; in altele gena tripla a este mult mai putin comuna decat gena single a. Aceasta sugereaza factori selectivi necunoscuti opereaza la nivelul diferitelor populatii si ajusteaza nivelul genelor.

Variatii ale numarului de gene a s-au observat relativ frecvent, ceea ce reprezinta un argument ca crossing-overul inegal la nivelul clusterului este destul de comun. El apare mult mai frecvent in clusterul a decat in cel b, probabil deoarece intronii genelor a sunt mult mai scurti impiedicand mai putin imperecherea inexacta dintre genele ne-omologe.

Deletiile care provoaca b-talasemiile sunt schematizate in figura 24.6. In unele cazuri (rare), este afectata numai gena b. Aceasta prezinta o deletie de 600 pb, care se intinde de la cel de al doilea intron catre limita regiunii 3'. In alte cazuri, sunt afectate mai multe gene. Multe dintre deletii sunt foarte lungim extinzandu-se catre capatul 5' (pe harta sunt indicate ca depasind 50kb spre dreapta).

Tipul Hb Lepore furnizeaza clasica ca deletiile pot rezulta in urma crossing-overului dintre gene linkate (linked genes). Genele b si d difera numai prin 7% din secventa. Prin recombinare inegala se inlatura materialul genetic dintre ele, astfel incat genele fuzioneaza (figura 24. 4). Genele fuzionate produc un singur lant proteic b care contine la capatul N-terminal secventa polipeptidei d unita cu cea a polipeptidei b la capatul C-terminal.

In prezent sunt cunoscute diferite tipuri de hemoglobine Lepore, diferenta dintre acestea constand in pozitia punctului de tranzitie de la secventa d la secventa b. Astfel, cand genele a si b se imperechiaza prin crossing-over inegal, punctul exact de recombinare determina pozitia la care se trece (switch) de la secventa d la cea b la nivelul lantului de aminoacizi.

Forma reciproca a acestui eveniment a fost gasita in hemoglobina Hb anti-Lepore, care este produsa de catre gena care are la capatul N-terminal o parte din gena b si la capatul C-terminal o parte din gena d. Fuziunea se produce intre genele normale d si b

Dovada ca un eveniment de crossing-over inegal poate avea loc si intre gene mult mai indepartate (ca structura) a fost furnizata prin identificarea Hb Kenya, o alta hemoglobina fuzionata. Aceasta contine secventa N-terminala a genei gA si secventa C-terminala a genei b. Fuziunea trebuie sa fi rezultat in urma unui crossing over inegal intre gA si b, care au o diferenta de secventa de peste 20%.

O varietate de deletii care impiedica atat sinteza catenelor d cat si b determina formarea a doua fenotipuri. In cazul HPFH (hereditary persistence of fetal hemoglobin), in general nu exista simptome clinice; boala este ameliorata deoarece sintezele hemoglobinelor fetale (a g2) continua si dupa perioada de dezvoltare in care in mod normal este dictata incheierea sa. In talasemia bd exista simptome de anemie, deoarece desi expresia genei g continua la adult, ea este mult mai slaba decat in cazul HPFH. Diferenta dintre HPFH si talasemiile bd depinde probabil de deletia unor secvente reglatoare prezente in interiorul clusterului, dar situate in afara structuri genelor d si b

Arbore filogenetic stabilit prin analiza clusterului genelor pentru beta-globine la diferite populatii

Clusterele de gene sufera reorganizari continue

Pornind de la diferentele observate intre clusterele genelor globinei de la diferite mamifere, putem concluziona ca duplicarile urmate (uneori) de variatie reprezinta o trasatura importanta a evolutiei fiecarui cluster. Deletiile prezente in talasemiile umane demonstreaza ca procesul de crossing-overul inegal continua sa apara pentru ambele clustere ale genelor globinei. Fiecare astfel eveniment se acest gen genereaza, in acelasi timp, duplicare si deletie, fapt care trebuie luat in consideratie pentru ambele tipuri de loci din populatie. Deletiile pot sa apara si (in principiu) prin recombinare intre secvente omologe pozitionate pe acelasi cromozom. Aceasta nu genereaza o duplicare corespunzatoare.

Este dificil sa estimam frecventa naturala a acestor evenimente, deoarece fortele selective ajusteaza rapid nivelele clusterelor variabile din populatie. Se poate realiza o corelatie grosiera intre nivelul crossing-overului inegal si genele inrudite, cu cat acestea sunt mai inrudite (atat la nivelul exonilor cat si a intronilor), cu atat este mai mare sansa de imperechere imperfecta. (totusi, unele evenimente de recombinare inegala nu implica genele insasi, ci sunt determinate de secvente apropiate de acestea).

In general o reducere a numarului genelor poate fi datorata aparitiei unei deletii insotita apoi de selectia acesteia. Totusi, in unele populatii, poate sa existe un echilibru avantajos care sa mentina forma purtatoare de deletie la o frecventa redusa.

Care este rezultatul unei astfel de expansiuni ? Singurul exemplu care a fost bine caracterizat este locusul a-triplu si anti-Lepore. Indivizii care poseda 5 gene pentru globina (un locus normal si un locus triplu) nu manifesta nici o modificare in ceea ce priveste sinteza hemoglobinei. Totusi, este posibil ca o crestere viitoare (al homozigotului triplu) poate sa determine modificari, prin dezechilibrarea sintezei globinei catre producerea unui exces de lanturi a. Indivizii cu anti-Lepore poseda o gena de fuziune db si au si una dintre genele normale b si d. Este posibil ca prezenta unor lanturi in plus sa interfere cu asamblarea normala a hemoglobinei.

Nu este de dorit ca aceste modificari particulare ale numarului de gene sa aiba un avantaj selectiv care le-ar putea asigura raspandirea in populatie. Dar structurile actualelor clustere de la om poseda numeroase duplicari care atesta importanta acestui mecanism. Secventele functionale includ doua gene a care codifica pentru aceeasi proteina, genele destul de bine inrudite b si dm si genele aproape identice g. Aceste duplicari independente relativ recente au aparut in populatie fara a mai mentiona duplicarile mai indepartate (mai vechi) care au generat diferitele tipuri de gene care codifica pentru globine. Alte duplicari au dat mastere pseudogenelor sau au fost pierdute. Este de asteptat ca duplicarile continue si deletiile sa fie o trasatura a tuturor clusterelor de gene.

pornind de la organizarea genelor globinei la o varietate de specii, se poate trasa evolutia actualelor gene care codifica pentru globine pornind de la o gena ancestrala. Punctul actual de vedere asupra evolutiei acestor gene este prezentat in figura 24.7.

Data fiind inclinatia (orientarea/proprietatea) intronilor de a se pierde in timpul evolutiei, gena leghemoglobinei de la plante, care este inrudita cu genele globinelor, poate fi prezentata ca o forma straveche. Aceasta are un intron in plus, care imparte domeniul de legare al hemului in doua parti, asa cum se poate vedea in figura 23.21.

Ultima etapa in procesul evolutiei genelor globinei, inainte de aparitia genelor actuale, este cea reprezentata de secventa monocatenara a mioglobinei, care incepe o evolutie divergenta fata de linia globinei (diverge fata de) acum aproximativ 800 milioane de ani. Gena mioglobinei are aceeasi organizare ca si genele globinei, deci putem considera structura cu trei exoni ca reprezentand structura stramosului lor comun, generata intr-o anumita etapa dupa separarea de plante (dupa divergenta de plante).

Anumite forme de 'pesti primitivi' au numai un singur tip de lant pentru globina, deci acestia trebuie sa fi suferit o evolutie divergenta de la linia evolutiva inainte ca gena ancestrala a globinei sa fi suferit procesele de duplicare care au dat nastere variantelor a si b. Aceste fenomen pare sa fi avut loc acum aproximativ 500 milioane de ani in urma, in timpul evolutiei pestilor ososi.

Urmatorul stadiu al evolutiei este reprezentat de starea genelor globinei la broasca X. laevis, care are doua clustere pentru genele globinei. Totusi, fiecare cluster contine atat genele a cat si b, atat la formele adulte cat si la formele larvare. Clusterul trebuie sa fi evoluat asadar prin duplicarea grupelor de gene likate a b, proces urmat de divergenta copiilor individuale. Mai tarziu intregul cluster a fost duplicat.

Amfibienii s-ai separat de linia mamifere/pasari aproximativ acum 350 milioane de ani, deci separarea genelor a si b ale globinelor trebuie sa fie rezultatul unei transpozitii la nivelul unui precursor al mamiferelor/pasarilor dupa etapa de separare a amfibienilor. Acest fenomen a aparut probabil in perioada timpurie a evolutiei vertebralelor. Odata ce s-au evidentiat clustere separate ale genelor care codifica pentru a si b globine atat la pasari cat si la mamifere, genele a si b trebuie sa se fi separat fizic inainte de divergenta mamiferelor si pasarilor din acest stramos comun. Un astfel de eveniment este posibil sa se fi produs acum aproximativ 270 milioane de ani.

Modificari la nivelul clusterelor a si b globinelor au mai aparut destul de recent, asa cum vom vedea mai departe din descrierea divergentei genelor individuale (figura 24.9).

Divergenta secventelor distinge doua tipuri de situsuri la nivelul ADN

Majoritatea modificarilor secventei proteice apar ca urmare a acumularii incep in timp de mici mutatii. Mutatiile punctiforme (point mutation), insertiile si deletii mici apar la intamplare cu o probabilitate mai mare sau mai mica in toate regiunile genomului, cu exceptia regiunilor fierbinti (hotspots) in care mutatiile apar mult mai frecvent. Majoritatea mutatiilor care schimba un aminoacid in secventa polipeptidica sunt vatamatoare (daunatoare/deleterious) si vor fi eliminate de catre selectia naturala.

Putine mutatii pot fi avantajoase, dar acelea care se pot raspandi in populatie, inlocuind probabil secventele fondatoare/formatoare. Cand o noua varianta inlocuieste versiunea anterioara a genei, se spune despre aceasta ca este fixata in populatie.

Un problema discutabila este ce proportie din mutatiile care determina modificarea unui aminoacid sunt neutre, adica fara nici un efect asupra functionalitatii proteinei, si sunt capabile sa se acumuleze ca rezultat al 'random drift and fixation' (miscarii/evolutiei intamplatoare si fixatiei).

Viteza (rata) cu care se acumuleaza modificarile determinate de mutatii (mutationale) este caracteristica fiecarui tip de proteina, si se presupune ca depinde cel putin in parte de flexibilitatea acesteia fata de modificare. In interiorul unei specii, o proteina evolueaza prin substitutii mutationale, urmate de eliminarea sau fixarea in interiorul fondului de crestere individual. Prezenta in populatie a doua (sau mai multe) variante alelice este numita polimorfism. Polimorfismul poate fi stabil, in care caz nici una din forme nu are nici un avantaj relativ, sau poate fi tranzitoriu, cazurile in care o varianta este inlocuita cu alta. Cand analizam fondul de gene al unei specii evidentiem numai variantele care au supravietuit.

Cand o specie se separa in alte doua specii noi, fiecare entitate nou constituita are un fond independent pentru evolutie. Daca comparam proteinele corespunzatoare de la doua specii, vedem diferentele pe care acestea le-au acumulat intre ele din momentul in care stramosii lor au incetat sa se interpuna. Anumite proteine sunt inalt conservate, fara sau cu mici diferente de la specie la specii. Aceasta indica ca aproape orice modificare este dezavantajoasa si este eliminata prin selectie.

Diferenta dintre doua proteine este exprimata prin divergenta lor, care reprezinta procentul de aminoacizi diferiti. Divergenta dintre proteine poate fi diferita de cea dintre secventele corespunzatoare de acizi nucleici. Sursa acestor diferente este data de faptul ca fiecare aminoacid este codificat de un codon compus din trei baze, in care modificarea celei de a treia baza nu are neaparat efect asupra citirii mesajului.

Secventa nucleotidica a unei regiuni codante poate fi impartita in 'replacement sites' (situsuri de substitutie) si 'silent sites' (situsuri mute/silentioase):

- La nivelul 'replacement sites', o mutatie modifica aminoacidul care este codificat. Efectul mutatiei (deteriorat, neutru, avantajos) depinde de rezultatul inlocuirii aminoacidului.

- La nivelul 'silent sites', mutatiile determina inlocuirea unui codon sinonim cu altul, deci in acest caz nu este vorba de o modificare a proteinei. De obicei situsurile in care se realizeaza substitutie constituie aproximativ 75% din secventa codanta si cele silentioase numai 25%.

Pe langa secventa codanta o gena contine si regiuni ne-traduse. La acest nivel mutatiile pot de asemenea sa fie potential neutre, in afara de cele care afecteaza structura secundara sau secventa semnal reglatoare.

Desi mutatiile silentioase sunt neutre in ceea ce priveste proteina, ele pot afecta expresia genei datorita modificarii secventei ARN. De exemplu, modificarea structurii secundare poate influenta transcriptia, procesarea sau translatia. O alta posibilitate este ca modificarea intr-un codon sinonim necesita un alt ARNt necesar pentru traducere, acest fapt putand influenta eficienta translatiei.

Mutatiile la nivelul situsurilor de substitutie pot sa corespunda cu divergenta aminoacizilor, care in esenta reprezinta procentajul de modificari. O divergenta a secventelor de acizi nucleici de 0,45% la nivelul situsurilor de substitutie corespunde unei divergente in aminoacizi de 1% (luand in considerare ca media numarului situsuri de substitutie pentru un codon este 2,25). In realitate divergenta masurata supraestimeaza diferentele care au aparut in timpul evolutiei, datorita frecventei evenimentelor la nivelul unui codon. De obicei aceste estimari sunt supuse unei corectii.

De exemplu, lanturile globinelor b si d de la om, prezinta 10 diferente in 146 de resturi, divergenta fiind de 6,9% la nivelul proteinei. Secventa de ADN are 31 de modificari in 441 resturi nucleotidice. Totusi, aceste modificari sunt distribuite foarte diferit la nivelul situsurilor de substitutie si a celor silentioase. Astfel, exista 11 modificari pentru 330 situsuri de substitutie, si 20 de modificari in 111 situsuri silentioase. Ratele de divergenta corecte sunt de 3,7% pentru situsurile de substitutie si de 32% pentru situsurile silentioase, ceea ce reprezinta deja un ordin de diferenta.

Aceasta impresionanta diferenta in divergenta constatata pentru situsurile de substitutie si cea pentru situsurile silentioase demonstreaza existenta unor constrangeri mult mai mari la nivelul pozitiilor nucleotidelor care influenteaza constitutia proteinei relativ la cele nu o influenteaza. Astfel, probabil foarte putine modificari ale aminoacizilor sunt neutre.

Ceasul evolutiv traseaza dezvoltarea genelor globinei

Cand o anumita proteina este analizata la o serie de specii, divergenta dintre secventele fiecarei perechi comparate este (mai mult sau mai putin) proportionala cu perioada de timp de cand acestea sunt separate. Aceasta furnizeaza un ceas evolutiv care masoara acumularea mutatiilor la o rata aparent egala in timpul evolutiei unei proteine date.

rata divergentei poate fi masurata ca procentul de diferenta per milion de ani, sau prin reciproca sa, unitatea de perioada evolutiva (UEP), timpul in milioane de ani care este necesar pentru aparitia unui procent de divergenta de 1%. Odata stabilit ceasul evolutiv prin comparatii intre perechi de specii (sa ne amintim dificultatile practice de stabilire a timpului actual de specuiatie), el poate fi aplica genelor inrudite de la aceeasi specie. Din divergenta lor putem calcula timpul scurs de la evenimentul de duplicare care le-a generat.

Prin compararea secventelor genelor omologe, se poate determina rata de divergenta atat a situsurilor de substitutie cat si a celor silentioase.

Pe baza compararii diferitelor perechi de gene (de la doua specii), s-a constat existenta unei divergente medii de 10% la nivelul situsurilor de substitutie fie pentru genele a sau b-globinei de la mamifere care au fost separate inainte de marea radiatie a mamiferelor acum aproximativ 85 de milioane ani. Aceasta corespunde unei rate a divergentei de substitutie de 0,12% per milion de ani.

Rata este constanta cand comparatia este extinsa la gene a caror divergenta este mult mai veche (mai indepartata in timp). De exemplu, media divergentei de substitutie dintre genele globinelor corespunzatoare de la mamifere si pasari (pui) este de 20%. Raportat la separarea care s-a produs acum aproximativ 270 milioane de ani, se ajunge la o rata de 0,09 per milion de ani.

Intorcandu-ne in timp putem compara genele a si b globinelor in interiorul speciilor. Acestea au suferit proces de divergenta de cand s-au separat tipurile de gene acum aprox 500 milioane de ani (vezi figura 24.7). Ele au o divergenta medie de substitutie 50%, care determina o rata de 0,1% per milion de ani.

Aceste date sunt prezentate in graficul din figura 24.8, care arata ca divergenta de substitutie in genele globinei prezinta o rata medie de 0,096% per milion de ani (sau o UEP din 10,4). Luand in considerare incertitudinile care pot sa apara in estimarea timpului la care s-a produs divergenta speciilor, rezultatele constituie un suport bun pentru ideea existentei unui ceas linear.

Datele privind divergenta la nivelul situsurilor silentioase sunt mai putin clare. In fiecare caz, este evident ca situsurile silentioase au o divergenta mai mare decat cea a situsurilor de substitutie (variaza dupa un factor 2 la 10). Deoarece divergenta la nivelul situsurilor silentioase este prea mare in cazul comparatiilor perechi consideram ca nu poate fi aplicat un ceas evolutiv acestor situsuri (trebuie sa ne bazam numai pe situsurile de substitutie)

In figura 24.8 se vede clar ca rata divergentei situsurilor silentioase nu este lineara in timp. Daca consideram ca divergenta trebuie sa fie zero la zero ani de separare, constatam ca rata de divergenta pentru situsurile silentioase este mai mare in primele 100 de milioane de ani de la separare. O interpretare este ca o fractie considerata grosier ca reprezentand jumatate din situsurile silentioase este rapid (in aproximativ 100 milioane ani) saturata in mutatii; aceasta fractie se transforma in situsuri neutre. Cealalta fractiune acumuleaza mutatii mult mai incet, la o rata de aproximativ egala cu cea caracteristica situsurilor de substitutie; aceasta fractie se identifica situsurile care sunt silentioase in ceea ce priveste proteina, dar care sunt supuse presiunii selective din alte motive.

Daca inversam modul de calcul aplicat pentru rata de divergenta putem estima timpul de separare a genelor intr-o specie (de cand s-au separat anumite gene in cadrul unei specii). Diferenta intre genele umane a si b este de 3,7% pentru situsurile de substitutie. Unei UEP (Unit Evolutionary Period ) de 10,4, aceste gene trebuie sa se fi separat (suferit divergenta) 10,4 x 3,7 40 milioane de ani inainte de separarea liniilor care au condus la formarea maimutelor Lumii Noi (New World monkeys), maimutelor Lumii Vechi (Old World monkeys), primatele mari si omul. Toate aceste primate mari au ambele tipuri de gene b si d, ceea ce sugereaza ca divergenta acestor gene a inceput imediat dupa acest punct evolutiv.

Daca analizam genele g si e constatam ca divergenta dintre situsurile de substitutie ale acestora este de 10% si corespunde unui timp de separare de 100 milioane de ani. Separarea dintre genele globinei embrionare si fetale trebuie sa fi precedat sau sa fi insotit radiatia mamiferelor.

In figura 24.9 este prezentat un arbore al evolutiei genelor umane ale globinei. Caracteristici (trasaturi) care s-au dezvoltat inainte de radiatia mamiferelor, cum este separarea formelor b d de g, trebuie sa fie prezente la toate mamiferele. Caracteristicile care au evoluat dupa, cum este separarea genelor a si b ale globinei, vor fi regasite in linii individuale ale mamiferelor.

Se considera ca in fiecare specie au avut loc modificari recente in structura clusterelor, atata timp cat constatam diferente in numarul genelor (o singura gena b la omul adult si doua la soarece) sau in tipul acestora (nu exista inca certitudinea existentei unei separari a genelor embrionare sau b-like in cazul globinelor de iepure si soarece).

Este clar ca evolutia cercetarilor va furniza date suficiente asupra secventelor unor gene particulare, si atunci exista mari sanse ca aceste argumente sa fie contrazise sau confirmate. Un lucru este totusi sigur: comparatiile dintre gene de la diferite specii pot fi folosite pentru trasarea corelatiilor taxonomice dintre specii pe baze moleculare.

Pseudogenele sunt capete moarte ale evolutiei

Pseudogenele sunt definite prin faptul ca poseda secvente inrudite cu cele ale genelor functionale, dar care nu pot fi traduse intr-o proteina functionala. O pseudogena este adesea notata cu simbolul y

Unele pseudogene poseda aceeasi structura generala ca si genele functionale, cu secvente care corespund exonilor si intronilor din pozitiile normale. Acestea au devenit inactive prin mutatii care pot afecta unul sau mai multe etape ale expresiei genelor. Modificarile pot fi semnale de desfiintare (intrerupere) a initierii transcriptiei, impiedicarea splicingului la nivelul jonctiunilor exon-intron, sau terminarea prematura a translatiei.

In mod normal o pseudogena ale numeroase mutatii care provoaca modificari, deoarece odata ce gena a incetat sa mai fie activa, nu exista nici un impediment ca ea sa acumuleze in continuare mutatii. Pseudogene care reprezinta versiuni ale genelor active curent au fost evidentiate in multe sisteme, incluzand globinele, imunoglobulinele, antigenele de histocompatibilitate, unde acestea sunt localizate in vecinatatea clusterului genelor active sau chiar in interiorul acestuia intercalate intre gene.

Un exemplu tipic este pseudogena de la iepure, by , care are o organizare obisnuita in exoni si introni, si este pozitionata foarte aproape de gena b1 a globinei. Eliminarea (deletia) unui perechi de baze la nivelul codonului 20 a by2 determina o modificare de faza care duce la terminarea fazei deschise de lectura imediat dupa aceasta pozitie (codon stop). In secventa exista si alte numeroase mutatii care determina modificarea altor codoni care semnifica aminoacizi bine conservati in structura b-globinelor. De asemenea, nici unul dintre introni nu mai poseda capetele de recunoastere a separarii lor de exoni, astfel incat este posibil ca intronii sa nu mai poata fi eliberati chiar daca gena ar fi transcrisa. Totusi, nu au fost evidentiati transcripti corespunzatori genei, probabil deoarece exista modificari si la nivelul regiunii 5' care flancheaza secventa codanta.

Cand exista o astfel de lista de mutatii care impiedica potential fiecare stadiu al expresiei genei, nu exista modalitati prin care sa putem detecta evenimentul original care a determinat inactivarea acestei gene. Totusi, prin divergenta dintre o pseudogena si o gena functionala, putem estima cand a aparut pseudogena si cand au inceput sa se acumuleze mutatiile la nivelul sau.

Daca pseudogena a devenit inactiva destul de repede dupa generarea sa prin duplicare din forma b1, ne putem astepta la o rata crescuta de divergenta (probabil aceeasi) atat pentru situsurile de substitutie cat si pentru cele silentioase (Nu mai este nici o motivatie ca acestea sa difere daca gena nu mai este tradusa). In acest caz sunt mai putine substitutii/mutatii in situsurile de substitutie decat in cele silentioase. Aceasta sugereaza ca in primul rand (in timpul in care gena era exprimata) a existat o selectie a mutatiilor la nivelul situsurilor de substitutie. Din dispunerea/extinderea relativa a modificarilor/mutatiilor/substitutiilor la nivelul celor doua situsuri, putem calcula ca pseudogena by s-a separat (a suferit divergenta) de gena b1 acum 55 milioane de ani, fiind o gena functionala timp de 22 milioane de ani si devenind pseudogena de cel putin 33 milioane de ani.

Calcule similare pot fi facute si pentru alte pseudogene. Unele par sa fi fost active un timp inainte de a deveni pseudogene, dar altele se pare ca au fost inactivate destul de repede dupa generarea lor initiala. Punctul general de vedere obtinut cu ajutorul structurilor acestor pseudogene este ca fiecare a evoluat independent in timpul dezvoltarii clusterului genelor globinei la fiecare specie. Aceasta intareste concluzia ca crearea de noi gene, urmata de acceptarea lor ca duplicate functionale, cu variatii intre aparitia unei noi gene functionale, sau inactivarea acestora ca pseudogene, este un proces continuu intr-un cluster de gene.

Pseudogena ay a genei globinei are o proprietate interesanta: ii lipsesc ambii introni. Aceasta secventa poate fi imprechiata cu ARNm pentru a-globina (tinand cont de mutatiile acumulate/avand in vedere). Timpul aparent de inactivare coincide cu duplicarea originala, ceea ce sugereaza ca evenimentul de inactivare a fost asociat cu pierderea intronilor. Cum au fost pierduti intronii ? Nu exista nici o motivatie ca sistemele de reconstituire a ADN sa recunoasca granitele exon-intron, acest fapt fiind un argument important pentru acceptarea idei implicarii ARNm in procesul de duplicare. Este probabil ca transcriptul invers al ARNm sa fi fost inserat in genom, probabil in urma actiunii unui retrovirus.

Secventele genomice care se aseamana unor molecule de transcript ARN sunt numite pseudogene procesate/prelucrate (processed pseudogenes). Pornind de la ideea ca acestea au luat nastere prin inserarea unui produs derivat din ARN, la nivelul unui situs intamplator, ele pot fi localizate in orice regiune a genomului, si nu neaparat pe acelasi cromozom ca gena activa.

Ce trasaturi sunt comune pseudogenelor ? Majoritatea familiilor de gene poseda membrii care sunt pseudogene. De obicei pseudogenele reprezinta o minoritate redusa din numarul total al genelor. Intr-un caz exceptional, totusi, exista o singura gena activa care codifica pentru o proteina ribozomala la soarece si exista 15 pseudogene procesate relative. O astfel de situatie trebuie luata in considerare cand se incearca calcularea numarului de gene folosind rezultatele hibridizarii acestora.

Daca pseudogenele sunt capete moarte din punct de vedere evolutiv, fiind simple secvente ne-dorite care insotesc genele functionale, de ce sunt ele inca prezente in genom ? Indeplinesc ele vreo functie sau nu au nici un scop, in acest caz de ce nu sunt supuse presiunii selective pentru a fi indepartate ?

Trebuie sa ne reamintim ca noi putem detecta genele care au rezistat (sunt inca prezente) in populatiile actuale. Este posibil, ca in trecut un anumit numar de pseudogene sa fi fost eliminat. Aceasta eliminare poate aparea prin eliminarea secventei sub forma unui eveniment neasteptat sau prin localizarea de mutati la unu asemenea nivel incat gena sa nu mai poata fi recunoscuta ca o secventa membra a familiei originale (este probabil soarta finala a oricarei pseudogene care nu este eliminata pe neasteptate).

Este posibil ca relicve ale evolutiei sa fie duplicate. In cazul genelor pentru b globina de la capra, exista doua specii adulte bA si bC. Fiecare dintre acestea are o pseudogena de cateva kilobaze in amonte (numite byZ si byX). Cele doua pseudogene sunt mai bine inrudite una cu cealalta decat cu oricare dintre cele doua gene b de la adult; in particular, ele manifesta multe mutatii care le inactiveaza. De asemenea, cele doua gene pentru b-globina de la adult sunt mult mai bine inrudite una cu alta decat cu pseudogenele. Aceasta implica ca structura originala by b a fost duplicata, dand doua gene functionale (care mai departe au suferit o evolutie divergenta ducand la bA si bC) si la doua gene ne-functionale (care au suferit o evolutie divergenta catre pseudogenele actuale).

Mecanismele responsabile pentru duplicarea genelor, deletie, si evenimente de rearanjare/redistribuire actioneaza asupra tuturor secventelor care sunt recunoscute ca membrii ai unui cluster, in conditiile in care acestia sunt sau nu functionali. Este dificil ca selectia sa poata discrimina intre produsi.

ADN mobil

Secventele de ADN mobile care sunt presarate in genomul plantelor si animalelor variind de la cateva sute la cateva mii de pb au fost pentru prima data descoperita la eucariote dar se gasesc si la procariote. Procesul prin care aceste secvente sunt copiate si inserate intr-un nou situs in genom se numeste transpozitie. Elementele mobile ADN sau elementele mobile simple sunt in esenta molecule parazite, carfe par sa nu aiba functii specifice in functionalitatea gazdelor lor, dar exista numai pentru a se automentine. Francis Crick le-a numit secvente "selfish".

Transpozitia elementelor ADN se crede ca se datoreaza unei acumulari progresive (incete) in genoamele eucariote in timpul unei perioade evolutive. Aceste elemente pot fi si pierdute cu o viteza foarte scazuta prin procesul de deletie ale segmentelor de ADN care le contin dar si prin acumularea mutatiilor pana cand aceste nu mai sunt recunoscute ca fiind inrudite cu elementul mobil original ADN. Deoarece elementele mobile sunt eliminate din genoamele eucariote destul de incet, acestea sunt acumulate pana la punctul in care ele constituie a proportie semnificativa a genoamelor multor eucariote.

Doua clase de elemente mobile

Figura: a) insertia secventelor si transpozomilor prin intermediarul ADN

b) Retrotranspozomii sunt mai intai transcrisi intr-o molecula de ARN, care apoi este revers-transcrisa in ADN dublu-catenar. In ambele cazuriintermediarii dublu catenari sunt integrati la nivelul secventei tinta ADN.

Deplasarea elementelor mobile implica ADN sau ARN ca intermediari.

Primul element mobil a fost descoperit de Barbara McClintock la porunb in 1940. Ea a caracterizat aceste entitati ca fiind capabile sa intre si sa iasa din gene, modificand fenotipul plantelor. Teoria sa a fost foarte controversata pana la cand elementele mobile au fost descoperite la bacterii, unde au fost caracterizate ca secvente specifice de ADN, si bazele moleculare ale transpozitiei lor au fost descifrate. Cand aceste elemente au fost descoperite, nu au fost corelate cu secventele moderat repetitive, care au fost anterior identificate in experimentele de reasociere. Astfel studiul elementelor mobile la eucariote a condus la detectarea elementelor mobile ADN la bacterii cu toate ca aparent nu existau conexiuni.

O data cu evolutia cercetarilor elementele mobile au fost impartite de doua categorii: 1) cele care sunt transpozate direct ca ADN; 2) cele care sunt transpozate prin intermediul ARN transcris de pe structura elementului mobil de catre o ARN polimeraza si apoi transformat in ADN dublu catenar de catre o revers-transcriptaza.

Elementele mobile care transpozeaza prin intermediul unui ADN sunt denumite transpozomi. Cele care transpozeaza la nivelul unor noi situsuri printr-un intermediar ARN sunt numiti retrotranspozomi deoarece deplasarea lor este analoga cu procesul de infectie al retovirusurilor. Intradevar, retrovirusurile pot fi considerate ca retrotranspozomi care implica gene care codifica anvelopa virala si care permit acestora sa transpozeze intre celule. Atat transpozomii cat si retrotranspozomii pot fi clasificati in functie de mecanismul lor specific de transpozitie

Elementele mobile sunt secvente ADN sau ARN

La bacterii majoritatea elementelor mobile sunt transpozate direct ca ADN. Din contra, majoritatea elementelor mobile de la eucariote sunt retrotranspozomi dar au fost identificati si transpozomi (ex cei initial descoperiti).

Structura generala a elementelor bacteriene IS

Prezenta elementelor mobile la bactgerii a fost pentru prima data evidentiata la E. Coli cand au fost evidentiate mutatii ca urmare a inserarii spontane a unei secvente de aprox 1-2 kb, in mijlocul un ei gene. Astfel de elemente se numesc elemente IS (insertion sequences). Au fost vizualizate prima data prin analiza microscopica a hibrizilorf (heteroduplexurilor) formate dintre tipul salbatec si cel mutant. Deoarece elementul IS integrat intr-o catena mutanta nu gaseste complement pe catena salbateca, formand o bucla monocatenara extinsa care se evidentiaza relativ usor la nivelul heteroduplexului. Astfel, la E. Coli au fost evidentiate peste 20 de elemente IS diferite. Cu toate acestea transpozitiile elementelor IS este un eveniment foarte rar, care apare numai la 105-107 celule/per generatie. Rate mai mari de transpozitie vor mari ratele de mutatii ale celulelor bacteriene. Cu rate foarte scazute de transpozitie, majoritatea celulelor gazda supravietuiesc si astfel propaga elementul parazit IS. La transpozitia elementului IS la nivelul unor situsuri aleatoare anumite secvente transpozate se plaseaza in regiuni neesentiale ale genomului (ex, regiunile dintre gene), crescand numai numarul de elemente IS din celula. Elementele Is se pot insera si in plasmide sau virusuri lizogene cand sunt transferate in alte celule. Cand se intampla acest lucru, elementele IS vor fi transpozate in celule virgine.

Figura: reprezinta structura generala a elementelor IS. Repetitiile inversate, de aproximativ 50 pb sunt invariabil prezente la capetele IS si au secvente caracteristice fiecarui tip de element. Intre repetitiile inversate exista o regiune codanta pentru proteine care codifica una sau doua enzime necesare transpozitiei elementului intr-un nou situs.

Un important semn distinctiv al al elementelor IS o reprezinta prezenta repetitiilor directe scurte, care contin 5-11 pb, imediat adiacente ambelor capete ale elementului inserat. Lungimea repetitiei directe este caracteristic fiecarui element IS, dar secventa sa depinde de situl secventei tinta la nivelul careia elementul IS este inserat. Cand secventa unei gene mutante care contine un element IS este comparata cu secventa salbateca dinainte de transpozare, se evidentiaza numai o singura copie a secventei repetitive directe in gena salbateca. Duplicarea acesteia pentru a da nastere unei noi secvente repetitive adiacente elementului IS apare in timpul procesului de inserare.

Structura generala a transpozomilor bacterieni

Enzima care caracterizeaza transpozitia unui element IS este numita transpozaza. In cel mai simplu mecanism de transpozitie, un element IS este este excizat dintr-o anumita localizare si este inserat intr-o noua pozitie in cromozomul bacterian printr-un proces nereplicativ.

In acest mecanism, moleculele transpozabile leaga secventele repetitive inversate prezente la fiecare capat al elementului IS din ADN donor si il cliveaza cu precizie (la un situs precis). Moleculele de transpozaza se leaga si ele si fac taieturi decalate intr-o secventa scurta din ADN tinta generand capete monocatenare. Aceasta enzima remarcabila leaga apoi capetele terminale 3' ale secventei tinta, umpland bresele monocatenare si generand o secventa repetitiva scurta chiar la capetele elementului IS nou inserat. Aceasta este originea repetitiilor directe scurte care flankeaza elementele IS. Anumite elemente IS transpozeaza printr-un mecanism replicativ mult mai complicat; in acest caz o copie a elementului IS original este generata in secventa tinta in timp ce copia originala este retinuta in secventa donoare ADN.

Transpozomii bacterieni. Pe langa elementele IS, bacteriile contin elemente genetice mobile compuse care sunt mai mari decat elementele IS si contin una sau mai multe gene care codifica pentru proteine, altele decat cele necesare pentru transpozitie. Denumite transpozomi bacterieni, aceste elemente sunt compuse din gene de rezistenta la antibiotice flancate de doua copii ale aceluiasi element IS. Inserarea unui transpozom intr-o plasmida sau in ADN cromozomal este usor detectabila datorita achizitionarii rezistentei la un anumit antibiotic. Transpozitia produce o repetitie directa scurta a secventei tinta de fiecare parte a transpozomului nou integrat, ca si pentru elementele IS.

Transpozomii sunt unelte importante pentru genetica bacteriana. Acestea pot fi introduse in plasmidele celulare sau in genoamele virale. O data transferati intr-o celula, transpozomii actioneaza ca mutageni care afecteaza numai o singura gena celulara. Deoarece transpozitia este un eveniment rar, celulele mutante sunt izolate datorita, mai ales, rezistentei la antibiotice pe care o achizitioneaza. Situsul unei transpozitii poate fi determinat prin cartare de restrictie care evidentiaza insertia mai ales in cazul transpozomilor mari ADN. Secventa precisa a ADN bacterian la nivelul situsului de insertie poate fi determinata prin secventiere, folosind un primer complementar cu secventa cunoscuta a repetitiilor inversate de la capatul transpozomilor.

Retrotranspozomii virali contin secvente LTR si se comporta in genom asemeni retrovirusurilor

Transpozomii de la eucariote.

Barbara McClintock care a descoperit prima elementele mobile a facut observatia ca anumite mutatii spontane care afecteaza producerea unora dintre enzimele necesare formarii antocianiunei, un pigment purpuriu. O clasa din aceste mutatii este reversibila cu o frecventa destul de mare in timp ce a doua clasa nu sufera reversii numai daca ele apar in prezenta primei clase de muatatii. McClintock a numit agentul responsabil de prima clasa de mutatii element activator (Ac) si l-a considerat responsabil de elementele celei de a doua clase elemente disociative (de disociere) (Ds) deoarece aceste tind si ele sa se asocieze cu ruperile (scindarile) cromozomale.

La multi ani dupa aceasta descoperire, clonarea si secventierea au evidentiat ca elementele Ds sunt deletate de catre elementul AC caruia ii lipseste o regiune a secventei care codifica pentru transpozaza. Totusi, la plantele care poseda elementul Ac si care poseda o tranpozaza functionala un elementele Ds nu se pot deplasa singure. Structura acestor elemente eucariote este similara cu elementele IS de la bacterii si par sa se deplaseze printr-un mecanism nereplicativ. O serie de elemente mobile au fost descoperite si la alte eucariote. De exemplu, aproximativ jumatate din mutatiile spontane observate la Drosophila sunt datorate insertiei elementelor mobile. Totusi majoritatea elementelor mobile de la Drosophila functioneaza ca retrotranspozomi. Cel putin unul-elementul P fuctioneaza ca un transpozom, deplasandu-se printr-un mecanism nereplicativ similar cu cel folosit de secventele de insertie de la bacterii. Metodele curente de contruire a drosophilelor transgenice depind de utilizarea expresiei crescute a elementului P si folosirea tintelor repetitive terminale pentru transpozitie.

Retrotranspozomii virali contin LTR si se comporta ca retrovirusurile in genom

Toate eucariotele studiate, de la drojdii la oameni, contin retrotranspozomi, elemente mobile ADN care transpozeaza prin intermediul ARN folosind o reverstranscriptaza (mecanismul b din figura anterioara). Aceste elemente mobile se pot imparti in doua categorii majore : retrotranspozomi virali si nevirali. Retrotranspozomii virali sunt abundenti la drojdii (ex elementele Ty) si la Drosophila (elementele copia). La mamifere, retrotranspozomii neretrovirali sunt cele mai comune tipuri de elemente mobile (vor fi descrise in continuare). Cu toate acestea, se estimeaza ca ca retrotranspsozomii umani reprezinta aproape 4% din ADN uman.

Structura genedrala a retrotranspozomilor virali de la eucariote este prezentata in fugura. In plus, pe langa repetitiile directe scurte din 5' si 3' toati retrotranspozomii virali sunt marcati prin prezenta unor repetitii terminale lungi (LTR-long terminal repeats) de 250-600 pb care flankeaza regiunea care codifica pentru proteina. LTR sunt caracteristice ADN retroviral integrat si sunt critice pentru ciclul de viata al retrovirusurilor. Mai mult, elementele Ty si copia codifica implica mecanisme similare celor prin care ADN retroviral este integrat in gennomul unei celule gazda si ARN retroviral este generat.

Generarea ARN genomic retroviral din ADN integrat retroviral

Trebuie sa tinem seama de fuctiile distincte ale ale celor doua LTR ale ADN retroviral integrat, in generarea ARN genomic retroviral, care corespund intermediarului ARN implicat in transpozitia elementelor Ty si copia. LTR din stanga functioneaza ca un promotor care directioneaza ARN polimeraza II din celula gazda pentru initierea transcriptiei incepand de la capatul 5' al secventei R. Dupa ce intregul ADN retroviral a fost transcris, secventa ARN corespunzatoare LTR dfin partea dreapta directioneaza enzimele care proceseaza ARN in celula gazda pentru a cliva transcriptul primar si a adauga coada poli (A) la capatul 3' al secventei R. Genomul retroviral rezultat este total lipsit de LTR. Totusi, dupa ce virusul infecteaza celulele, revers-transcriptia genomului ARN de catre revers-transcrptaza codificata de catre virus conduce la un ADN dublu-catenar cu secvente LTR.

Generarea secventelor LTR in timpul revers-transcriptiei ADN genomic retroviral (1)

Figura: O serie complicata de 9 evenimente genereaza o copie ADN dublu-catenara a genomului ARN al retrovirusului.ARN genomic este impachetat intr-un virion cu un ARNt retroviral specific hibridizat cu o secventa complementara situata in apropierea capatului 5' si numita Primer Binging Site (PBS). ARN retroviral are o secventa scurta repetitiva la fiecare capat al secventei R. Intreaga reactie este catalizata de catre revers-transcriptaza care realizeaza sinteza ADN si si digera ARN din hibridul ADN/ARN. Intregul proces conduce la o molecula dublu-catenara de ADN care este mai lunga decat matrita ARN si poseda LTR la fiecare capat.

Integraza, o alta enzima codificata de catre retrovirus, insereaza apoi ADN dublu-catenar retroviral in genomul celulei gazda; in acest proces, secventele repetitive scurte directe ale secventei tinta sunt generate la fiecare capat al secventei virale inserate.Ca si ADN retroviral, elementele Ty si copia codifica reverstranscriptaza si integraza; se considera ca aceste enzime functioneaza transformand intermediarl ARN in ADN si inserand ADN in situsul tinta intr-o maniera similara retrovirusurilor.

Elementele Ty transpozeaza intr-o proportie foarte scazuta, probabil datorita insertiei aleatoare a elementelor Ty in fiecare genom, care contin un "spacer" relativ mic si un intron ADN, care adesea inactiveaza genele. Totusi, cand celulele de drojdii sunt transformate cu plasmide care contin elementul Ty clonat dupa un promoter sensibil la galactoza, producerea ARNm pentgru Ty si transpozitia Ty este mai mare in prezenta galactozei decat in absenta acesteia. Aceasta crestere a fenomenului de transpozitie a Ty este rezultatul cresterii ARNm al Ty, care poate functiona ca o matrita pentru revers-transcriptaza si integraza exprimata de Ty.

In contrast cu elementele Ty, regiunea codanta de a elementelor Ac de la porumb contine introni. Prezenta intronilor in elementele Ac sustine concluzia ca ei transpozeaza prin directa deplasare a secventelor de ADN si nu prin rfevers-transcrierea unui intermediar ARN.

Generarea secventelor LTR in timpul revers-transcriptiei ADN genomic retroviral (2)

Retrotranspozomii ne-retrovirali sunt lipsiti de secvente LTR

Retrotranspozomii ne-retrovirali nu poseda LTR si se deplaseaza printr-un mecanism neobisnuit

Cele mai abundente elemente mobile la mamifere sunt retrotranspozomii ne-retrovirali carora le lipsesc LTR. Multe dintre acestea apartin la doua clase de elemente moderat repetitive care se gasesc la mamifere: Long Interspersed Elements - LINES si Short Interspersed Eledments - SINE. La mamifere a fost identificata o clasa de secvente SINE si peste 10 clase de secvente LINE. LINE au fost evidentiate si la protozoare, insecte si plante dar din motive necunoscute poseda o distributie mult mai larga la mamifere.

Numarul mare de secvente SINE si LINE la eucariotele superioare au fost acumulate evolutiv prin copierea repetata a unei secvente la nivelul catorva pozitii din genom si inserarea copiilor in noi pozitii. Nu contin secvente LTR.

Retrotranspozomii ne-retrovirali se deplaseaza printr-un mecanism "neobisnuit"

Elementele LINE L1

Cele mai comune elemete line la mamifere sunt familia L1. In genomul uman sunt peste 600 000 copii ale L1 (aprox 15% toatal genom).

Structura generala a L1 se bazeaza pe o secventa consens (medie) prezentata in figura. Elementele L1 sunt de obicei flancate de scurte repetitii directe, marca elementelor mobile. Secventa consens contine doua faze de lectura de aprox 1 kb si 4 kb. ORF1 codifica pentru o proteina de legarea a ARN iar ORF2 este similara cu secventa reverstranscriptazei din retrovirusuri sau din retrotranspozomii virali.

Dovezile privind deplasarea elementelor L1 vin din analizele ADN uman clonat de la pociedntii cu diferite maladii genetice. Analiza ADN de la acesti pacienti a evidentiat ca mutatiile pe care le purtau se datorau insertiei unui element L1 la nivelul unui gene, fara ca un astfel de elemt sa fie prezent la parinti.

Deoarece elementele L1 nu contin secvente LTR inseamna ca mecanismul lor de transpozitie prin intermediul ARN trebuie sa difere de cel al reztrotranspozomilor virali la care LTR au rol crucial. Studiile in vitro au indicat ca transcriptia lui L1 este directionata de secvente promotoare localizate la capatul stang al elementului. La capatul din dreapta a fost evidentiata o regiune bogata in A/T care genereaza care se continua cu resturi A in transcriptii ARN.

Adesea secventele L1 contin codoni STOP si mutatii "frameshift" la nivelul ORF1 si ORF2, acestea fiind acumulate in L1 in timpul evolutiei. Mentinerea transpozitiei L1 necesita ca macar o secventa L1 aa isi pastreze intacte fazele de lectura care codifica pentru reverstranscriptaze si celelalte proteine necesare transpozitiei L1.   

Elementele ADN mobile au probabil o influenta semnificativa in evolutie

Cu toate ca elementele ADN mobile nu par sa aiba o functie directa alta decat mentinerea propriei existente, prezenta lor probabil a avut si are un impact major in evolutia organismelor.De exemplu:

- elementele mobile evidentiate ca inducand mutatii spontane la Drosophila ca urmare a inserarii intr-o sau in apropierea unei unitati de transcriptie;

- elemtele mobile detectate in genele mutante.

In plus, recombinarea omologa intre elementele mobile disxpersate de-a lungul genoamelor ancestrale pot avea un important rol in duplicarea genelor si in alte rearanjamente de-a lungul evolutiei. Clonarea si secventializarea clusterului beta-globinelor de la diferite specii de primate au evidentiat ca genele Gg si Ag au aparut ca urmare a crossing-overului omolog inegal dintre doua secvente L1.

Astfel de duplicari si rearanjamente ale ADN contribuie mult la evolutia noilor gene. Se poate considera ca duplicarea genelor este anterioara evolutiei unui numar mic de familii de gene care ulterior au achizitionat functii utile si distincte.

ADN mobil a putut in fluenta si evolutia genelor care contin mai multe copii a unor exoni similari care codifica domenii proteice similare (de ex gena fibronectinei). Recombinarea omologa intre elementele mobile inserate in introni contribuie probabil la evolutia intronilor unor astfel de gene. Unele studii sugereaza ca in timpul evolutiei eucariotelor superioare, apare recombinare intre intronii unor gene distincte, generand noi gene formate din noi combinatii de exoni pre-existenti. De exemplu, activatorul tisular al plasminogenului, receptorul Neu, factorul de crestere epidermala contin un domeniu EGF

Domeniile structurale si functionale sunt module ale structurii tertiare

Evolutia genelor care codifica aceste proteine ar fi putut implica recombinari intre elemente mobile care au avut drept rezultat insertia unui exon care codifica EGF intr-un intron al unei forme ancestrale ale fiecareia dintre aceste gene. Termenul "exon shuffling" (amestecare a exonilor) a fost introdus pentru a defini acest tip de proces evolutiv.

Recombinarea dintre elementele mobile poate sa fi jucat un rol si in determinarea genelor specifice care sunt exprimate in anumite tipuri celulare particulare si privind nivelul expresiei acestora in anumite momente ale dezvoltarii celulare sau a organismului.

Asa cum am discuta genele eucariote poseda regiuni de control a transcriptiei, numite ENHANCER care pot opera la o distanta de mii de perechi de baze. De asemenea transcriptia unei gene poate fi controlata prin efectul combinat a mai multor sevente "enhancer". Recombinarea elementelor mobile inserate aleator langa "enhancer" poate contribui la evolutia combinatiilor de "enhancers" care controleaza genele la organismele moderne.

Rearanjamente functionale la nivelul ADN cromozomial

In contrast cu transpozitia elementelor mobile in ADN genomic, care par sa nu serveasca direct, funtionarii imediate a organismului, exista diferite tipuri de rearanjamente ale regiunilor ADN care sunt benefice pentru organism. Aceste rearanjamente functionale, care au fost identificate atat la eucariote cat si la procariote, apar prin inversii si deletii ale segmentelor de ADN si prin amplificarea ADN. Aceste aranjamente functionale joaca si un rol important in reglarea unor gene, cel mai frecvent mecanism de control implicand reglarea transcriptiei.

Genele pentru anticorpi sunt asamblate prin re-aranjarea liniilor ADN germinale

Unul dintre cele mai remarcabile aspecte ale raspunsului imun este vasta diversitate a anticorpilorcare pot fi orientati catre multe antigene posibile si particule individuale. Se estimeaza ca un individ poate produce potential mai multe milioane de tipuri de anticorpi cu specificitati pentru tot atatea tipuri de antigene diferite. Un milion de molecule de anticorpi diferiti nu pot fi codificati direct de genomul uman, cand genomul contine numai aproximativ 100 000 de gene. Mecanismul molecular de generare a unei astfel remarcabile diversitati pornind de la o cantitate limitata de ADN este acum inteles. Inversiile si desatiile regulate au un rol important in proces. Pentru a intelege cum se realizeaza acest lucru trebuie mai intai sa ne amintim structura anticorpilor.

Structura pe domenii a anticorpilor

Anticorpii apartin unei clase de proteine numite imunoglobuline, care constituie aproximativ 20% din proteinele din sange. Cel mai abundent tip de anticorpi, imunoglobulinele G (IgG) sunt molecule simetrice compuse din patru lanturi polipeptidice: doua identice grele H (heavy) de 55 kDa si doua identice usoare L (light) de 23 kDa. Lanturile usoare sunt compuse din doua domenii, un domeniu terminal numit VL, deoarece este usor diferit sau "variabil" ca secventa si ca structura diferitelor molecule de anticorpi, si un domeniu C terminal numit CL, care are o structura identica sau "constanta" in toate moleculele IgG. Similar, lanturile grele sunt compuse din patru domenii , un domeniu N-terminal variabil VH si trei domenii constante denumite CH1, CH2, CH3.

Moleculele de anticorp leaga o molecula de antigen prin intermediul suprafetelor create la intefata domeniilor VL si VH ale antenelor in Y ale moleculei. In consecinta, specificitatea de legare a unui anticorp este determinata de secventa dfomeniilor VL si VH.

Organizarea lanturilor usoare

Organizarea lanturilor usoare ADN

Anticorpii sunt produsi de limfocitele B. Genele care codifica anticorpi cu diferite specificitati de legare nu sunt mostenite direct din oul fertilizat. Mai degraba acestea sunt asamblate dintr-un numar de fragmente separate prezente in ADN-ul liniei germinative; acest proces apare in timpul dezvoltarii celulelor B din celulele stem ale maduvei spinarii. De exemplu, un aranjament functional al genelor care codifica pentru lantul usor k (tipul major de la soarece si la om) contine trei segmente. La capatul 5' este segmentul Lk; acesta codifica pentru o peptida semnal sau ledader care directioneaza proteinele nou traduse in reticolul endoplasmatic pentru prepararea secretiei extracelulare a acestora. In timpul procesului post-translational peptida semnal este inlaturata din structura lantului usor si nu este prezenta in molecula de anticorp matura. Cel de al doilea segment codifica pentru domeniul VL al lantului usor si al treilea segment de la capatul 3' codifica pentru domeniul CL.

Asa cum vedem in figura, ADN-ul celulelor germinative si a altorf celule cu exceptia limfocitelor B mature (i.e. Sperma,ou) contin un locus k care poseda o regiune variabila la capatul sau 5'. Aceasta regiune consta intr-o banca segmente leader Lk si variabil Vk continand aproximativ 100Lk +Vk unitati la om; aceste unitati sunt distribuite in tandem de-a lun gul unui fragment de ADN. ( Segmentul Lk corespunde exonului leader din gena finala; segmentul Vk prinde majoritatea dar nu intreg exonul final VL care codifica regiunea variabila a lantului usor). Fiecare dintre unitatile Lk +Vk sunt lungi de aproximativ 400 nucleotide si sunt separate de aproximativ 7 kb; astfel 100 de unitati Lk+Vk acopera aproximativ 740 kb. Regiunea variabila a locusului k este urmata de cinci segmemente de imbinare (joining-Jk) si un segment constant Ck, in ADN germinativ uman. Cele 5 segmente Jk sunt dispuse in tandem si sunt separate de aproximativ 20 kb de capatul 3' al regiunii variabile. Fiecare dintre segmentele Jk este de aproximativ 30 nucleotide si sunt imprastiate pe o distanta de aprox 1,4 kb. Intre segmentul 3' Jk si segmentul circular Ck exista un fragment de 2,4 kb. Numarul segmentelor Vk si Jk variaza cu speciile de mamifere, totusi exista intotdeauna mult mai multe segmente Vk decat Jk.

Rearanjarea ADN care codifica lanturile usoare

Rearanjarea lanturilor usoare ADN

Cand ADN se reorganizeaza pentru a face functionala o gena k, un segment Vk este reunit cu un segment Jk. Aceasta reunire este realizata de o recombinaza situs-specifica care recunoaste secventele de la capatul 3' al fiecarui segment Vk si capetele 5' ale segmentului Jk. Recombinarea intre aceste secvente are ca rezultat o deletie si o inversiune la nivelul secventei participante, depinzand daca unitatea Lk + Vk poseda aceeasi orientare transcriptionala sau orientare opusa fata de segmentul Jk. Aceasta recombinare formeaza regiunea variabila completa. Mai mult, se cunoaste ca orice Vk se poate reuni cu cu oricare Jk alegerea fiind aleatoare. O data ce segmentele Vk si Jk sunt reunite, regiunile variabile si constante sunt transcrise impreuna intr-un transcript ARN primar. Secventele care intervin intre Lk si Vk si intre Jk si Ck (icluzand oricare dintre regiunile Jk ramase) sunt apoi inlaturate prin splicigul ARN pentru a obtine proteina lantului usor k.

Atata timp cat fiecare segment Vk si Jk are o secventa nucleotidica unica, reunirea Vk-Jk alre celor 100 segmente Vk si 5 segmente Jk in liniile germinative umane poate produce 500 posibile lanturi diferite. Dar reunirea Vk-Jk genereaza o si mai mare variabilitate decat pot sugera aceste calcule deoarece un numar mic, variabil de nucleotide sunt pierdute din segmentele Vk si Jk atunci cand ele sunt reunite. Imprecizia procesului de reunire creste mult diversitatea secventei posibile de aminoacizi a VL codificata de catre regiunile Vk-Jk reunite. Semnificativ aceasta regiune codifica multi dintre aminoacizii din situsul de legare a antigenului la capatul domeniului VL.

Pierderea aleatoare a nucleotidelor la situsul de reunire genereaza o diversitate semnificativa in acest punct, dar sistemul plateste pentru aceasta diversitate. Costul este evident daca ne amintim constringerile unei structuri codante. Trebuie sa tinem seama ca o secventa codanta trebuie citita sub forma de triplete, si ca AUG (metionina) este codonul care defineste o faza de lectura care grupeaza restul regiunii codante in triplete. Astfel reunirea a doua piese de fragmente de ADN cum sunt Vk si Jk pot produce o noua faza de lectura corecta sau incorecta care produce proteina non-sens. Deoarece reunirea segmentelor se face aleator, doua di trei reuni determina formarea unei proteinre non-sens.

In concluzie, au fost descrise trei surse de diversitate:

- variabilitatea secventei multor segmente Vk la nivelul locusului k;

- variabilitatea variabilitatea secventelor unui mic numar de segmente Jk;

- variabilitatea numarului de nucleotiode deletate la reunirea Vk-Jk.

Exista si alte procese care genereaza o mult mai mare variabilitate prin modificarea secventei ADN la nivelul reunii segmentelor.

Organizarea si rearanjarea secventelor ADN ale lanturilor grele

Organizare si rearanjamentul lanturilor grele ADN

Genele functionale care codifica lanturile grele ale anticorpilor sunt formate prin procese similare celor deja descrise anterior pentru lanturile usoare. Analiza situsurilor de legare ale a antigenelor la numerosi anticorpi sugereaza ca contributia lanturilor grele la contactul cu antigenele este chiar mai mare decat contributia lanturilor usoare. In concordanta cu necesitatea de diversitate la nivelul lanturilor grele, trei banci de segmente genetice contribuie la variabilitatea regiunii functionale a lanturilor grele. Primedle doua sunt formate din bancile fragmentelor VH si JH ale lanturilor grele iar cea de a treia este formata din diversitatea segmentelor D (diversity) care sunt localizate intre celelalte dolua banci.

Diversitatea este asigurata de doua procese de reunire, VH cu D si D cu JH. Cu siguranta ca reunirea a trei fragmente ofera o diversitate mult mai mare de combinare. ADN din liniile germinale umane contine aproximativ 100 segmente Vh, 30 segmente D si 6 segmente functionale JH. Pe langa diversitatea furnizata de reunirile aleatoare ale segmentelor VH cu D si a D cu JH o anumita diversitate este furnizata de pierderea nucleotidelor la realizarea jonctiunilor care apar la combinarea segmentelor. ADN pentru lanturile grele din liniile germinale contin si multiple segmente C care codifica pentru domeniile constante ale regiunii claselor de IgG variabile. O combinare intre procesarile alternative ale ARN si aranjamentele aditionale (switching-ul clasei) determina ce clasa de IgG este exprimata in anumite tipuri de celule B.

Amplificarea generalizata produce cromozomi politeni

Amplificarea generalizata a ADN produce cromozomi politeni

Toate rearanjamentele ADN discutate anterior atat functionale cat si nefunctionale implica modificari ale pozitiilor secventelor in cadrul genomului. Alt tip de rearanjament implica amplificarea generalizata a secventelor ADN sau politenizarea.

Este exemplu glandelor salivare de la Drosophila care contin cromozomi mari in interfaza. Cand fixam si coloram acesti cromozomi, ei se caracterizeaza printr-un mare numar de benzi demarcate, care pot fi utilizate pentru a stabili pozitia si ordinea genelor la Drosophila. Marirea cromozomilor din glanda salivara si din alte celule de la Drosophila, aparea atunci cand ADN se replica repetitiv si cromozomii obtinuti nu sunt separati. Rezultatul este formarea cromozomilor politeni compusi din multe copii paralele . Amplificarea ADN cromozomal creste mult numarul de copii de gene, probabil pentru a suplini necesitatea de ARNm pentru sinteza proteica care are loc celulele aceastei glande salivare masive. Totusi, la majoritatea cromozomilor care participa la politenizare, anumite secvente cum sunt secventele simple ADN de la nivelul centromerilor si telomerilor nu sunt amplificate. Mai mult genmele ribozomale tind sa fie amplificate mai putin decat alte sevente.

Mecanismul molecular al acestor procese este necunoscut , dar se pare ca secventele simple ADN contribuie probabil la alinierea ADN amplificat de-a lungul lungimii cromozomilor politeni.



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 3302
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved