CATEGORII DOCUMENTE |
BAZE DE DATE DISTRIBUITE
1.1. SISTEME GESTIUNE ALE BAZELOR DE DATE DISTRIBUITE
Concepte si proiectare
O multime de baze de date repartizate fizic pe site-uri diferite ale unei retele de calculatoare, gestionate de acestea si conectate logic se numeste baza de date distribuita (BDD).
BDD apare ca o baza de date unica in viziunea utilizatorului.
Sistemul de programe care permite gestiunea unei BDD si face transparenta gestiunea pentru utilizator se numeste sistem de gestiune a unei baze de date distribuite (SGBDD).
Obiective:
De ce sunt necesare bazele de date distribuite;
Diferenta intre sisteme de baze de date distribuite, procesari distribuite si
sisteme de baze de date paralele;
replicare si alocare;
Tehnologia BDD a copiat din paradigma prelucrarii datelor, in care fiecare aplicatie defineste si actualizeaza datele proprii ca una in care datele sunt definite si administrate central. In ultimul timp am vazut o dezvoltare rapida a tehnologiei comunicatiilor de date si a retelelor, ilustrate de Internet (wireless ). SGBD distribuite (SGBDD) permit utilizatorilor sa acceseze nu numai date de pe propriul site, dar de asemenea si date memorate pe site-uri la distanta.
O motivatie majora a dezvoltarii SGBD este dorinta de a integra datele operationale ale organizatiei si a da un acces controlat la date. Astfel dezvoltarea retelelor de calculatoare promoveaza un mod descentralizat de lucru. Abordarea descentralizata oglindeste structura organizationala a unor multimi de companii care sunt logic distribuite in divizioane, departamente, proiecte s.a.m.d. si fizic distribuite in oficii, ateliere, unde fiecare unitate mentine datele operationale ale ei proprii.
Partajabilitatea datelor si eficienta accesului la date ar trebui imbunatatite de SGBDD ce reflecta aceasta structura organizationala care transforma datele intr-un tot unitar si memoreaza datele in apropiere de locurile unde sunt frecvent utilizate.
Un SGBDD consta dintr-o singura BD logica ce este impartita intr-un numar de fragemente. Fiecare fragment este memorat pe unul sau mai multe calculatoare ale retelei sub controlul unor SGBD separate cu calculatoare conectate printr-o retea de comunicatie. Fiecare site este capabil sa prelucreze independent cererile utilizatorului care are acces la datele locale (adica fiecare site are un grad de autonomie locala) si este capabil de prelucrari de date memorate pe alte calculatoare din retea. Utilizatorii acceseaza BDD prin intermediul aplicatiilor. Aplicatiile se clasifica in locale (care nu cer date de pe alte site-uri) si globale (care cer date de pe alte site-uri). Vom cere ca SGBDD sa aiba cel putin aplicatie globala.
Un SGBDD are urmatoarele caracteristici:
colectie de date partajate si legate logic;
Datele sunt sparte intr-un numar de fragemente;
Fragmentele pot fi replicate;
Fragmentele/replicile sunt alocate pe site-uri;
Site-urile sunt legate printr-o retea de comunicatie;
SGBD de pe fiecare site poate prelucra aplicatii locale autonome;
SGBD participa la cel putin o aplicatie locala.
O baza de date ce poate fi accesata de pe un calculator al retelei constituie o prelucrare distibuita. Punctul cel mai important al unui sistem distribuit consta din faptul ca datele sunt distribuite pe un numar de site-uri dintr-o retea. Daca datele sunt centralizate si ele pot fi accesate dintr-o retea consideram ca nu formeaza un sistem distribuit.
SGBDD pot fi omogene daca pe fiecare calculator al retelei se afla acelasi tip de SGBD local si eterogene in caz contrar.
SGBDD etrogene trebuie sa asigure localizarea datelor si realizarea oricarui tip de translatare necesara deoarece datele pot fi cerute de la alte site-uri ce pot avea: hardware diferite, SGBD locale diferite sau amandoua diferite.
Sisteme de gestiune a bazelor de date paralele - SGBDP
Vom face o distinctie intre sistemele de gestiune a bazelor de date distribuite (SGBDD) si sistemele de gestiune a bazelor de date paralele (SGBDP).
Un sistem de genstiune a bazelor de date paralele (SGBDP) este un SGBD care se executa pe mai multe procesoare si discuri ce sunt proiectate sa execute operatii in paralel, ori de cate ori este posibil si in plus sa realizeze mari performante. Exista trei arhitecturi principale pentru BD paralele:
a) cu memorie partajata:
Figura 1. Arhitectura SGBDP cu memorie partajata
b) cu disc partajat:
Figura 2. Arhitectura SGBDP cu disc partajat
c) nimic partajat:
Figura 3. Arhitectura SGBDP cu nimic partajat
SGBD-urile paralele se bazeaza in esenta pe premisa ca un sistem cu un singur procesor nu poate mult timp sa satisfaca cerintele de eficienta, scalabilitate, fiabilitate si performanta. O alternativa la SGBD cu un singur procesor sunt SGBD paralele date cu procesoare multiple. Pentru a realiza ca mai multe procesoare sa aiba acces in comun la o BD, un SGBDD trebuie sa realizeze o gestiune de resurse partajate de date. Care resurse sunt partajate si cum sunt ele implementate determina scalabilitatea si performanta sistemului.
Arhitectura unui SGBDD
In acest paragraf vom arata cum distribuirea afecteaza arhitectura si functiile cerute. Vom presupune ca un SGBDD are toate functiile unui SGBD centralizat.. In plus vom cere ca un SGBDD sa aiba urmatoarele functionalitati:
servicii extinse de comunicatie care sa permita accesul la distanta pe diferite site-uri si un transfer de intrebari si date intre site-uri care utilizeaza o retea;
un catalog de sistem extins care sa stocheze detaliile de distributie a datelor;
procesari de intrebari distribuite care includ optimizari de intrebari si acces la date la distanta;
control extins pentru securitate care mentine privilegiile de acces si autorizare la date distribuite;
controlul concurentei ce mentine consistenta datelor replicate;
servicii de recuperare extinse care sa tina cont de erorile site-urilor individuale si a comunicatiilor.
Este mult mai greu sa se prezinte arhitectura unui SGBDD care sa fie general valabila datorita diversitatii acestora.
Completarea arhitecturii unui SGBD este data in figura 4 si consta din urmatoarele scheme:
Legaturile in aceasta figura reprezinta mapari intre diferite scheme.
Schema conceptuala globala (SCG)
Shema conceptuala globala (SCG) este o descriere logica a intregii baze de date ca si cand n-ar fi distribuita. Acest nivel corespunde la nivel conceptual al arhitecturii ANSI-SPARC si contine definitii de entitati, legaturi, restrictii, securitate si informatii de integritate.
Schema interna a datelor da independenta logica a datelor.
Figura 4. Arhitectura completa a unui SGBDD
Schema de fragmentare este o descriere a modului cum datele sunt partitionate logic. Schema de alocare este o descriere a modului cum datele sunt localizate si tinand cont de orice replicare.
Scheme locale
Fiecare SGBD local are o multime proprie de scheme. Schemele conceptuale locale si interne corespund schemelor la nivel echivalent de arhitecturi ANSI-SPARC.
Completarea arhitecturii pentru siteme de gestiune a bazelor de date multi federale (SGBDMF)
Am vazut ca un sistem cu mai multe baze de date este un SGBD distribuit in care fiecare site este complet autonom. Sistemele federale difera de SGBDD prin nivelul de autonomie locala cu care este inzestrat. Aceasta diferenta este de asemenea reflectata in completarea arhitecturii. In figura 5 se da o completare a SGBDMF care sunt cuplate strans, adica au o schema conceptuala globala.
In SGBDD schema conceptuala globala este o reuniune a tuturor schemelor conceptuale locale. In SGBDMF, schema conceptuala globala este o submultime de scheme conceptuale locale care constau din datele fiecarui sistem local compatibil cu partajarea. SCG a sistemului implica o integrare a fiecarui parti din schema conceptuala locala sau schema externa locala.
In arhitectura unui SGBDD vom distinge 4 componente majore:
1. SGBD locale (SGBDL);
2. Componenta de comunicatii de date (CD);
3. Componenta data de catalogul de sistem global (CSG);
4. Componenta de sistem de gestiunea a bazei de date de date distribuite (SGBDD).
Figura 5. Completarea arhitecturii SGBDMF
Figura 6. Componente ale arhitecturii unui SGBDD
1. Sistemul de gestiune a bazei de date local (SGBDL) este responsabil de controlul datelor locale de pe fiecare site si are un catalog de sistem local propriu.
2. Componenta de comunicatie a datelor (CD) este un software ce permite ca toate site-urile sa comunice intre ele. Componenta CD contine informatii despre site-uri si legaturi.
3. Catalogul de sistem global (CSG) ca baza de date distribuita contine informatii specifice despre natura distributiei sistemului ca: fragmentarea, replicarea si scheme de alocare. Ele insusi pot fi gestionate ca BDD si pot fi fragmentate si distribuite, complet replicate sau centralizate, ca orice BD. Orice CSG complet poate fi complet replicat sau centralizat ca orice relatie. Un CSG complet replicat care impaca cu autonomia site-ului si orice modificare a CSG trebuie comunicata la toate site-urile. Un catalog de sistem global se impaca cu autonomia site-urilor dar devine vurnerabil la penele site-ului central.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 3187
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved