CATEGORII DOCUMENTE
Afaceri Calculatoare Casa masina Didactica pedagogie Diverse Educatie Finante Geografie Istorie & politica Legislatie Limba Management Sanatate Tehnologie

Astronomie	Biofizica	Biologie	Botanica	Carti	Chimie	Copii
Educatie civica	Fabule ghicitori	Fizica	Gramatica	Joc	Literatura romana	Logica
Matematica	Poezii	Psihologie psihiatrie	Sociologie

Principiile generale ale tehnicilor de recunoastere a formelor

Matematica

+ Font mai mare | - Font mai mic

DOCUMENTE SIMILARE

Clasa a VII-a Varianta nr. 1 Teza Unica la matematica

Teza Unica la matematica

LINII IMPORTANTE IN TRIUNGHI

REPREZENTAREA DREPTEI

Functii omogene de mai multe variabile

Tabel de integrale nedefinite

Reprezentarea sistemelor prin functie de transfer

INDICII SI RITMUL VARIATIEI FENOMENELOR ECONOMICO-SOCIALE

CONICE - Conice pe ecuatia generala. Conice pe ecuatii reduse

Cuadrice date prin ecuatii reduse

Principiile generale ale tehnicilor de recunoastere a formelor

Introducere

Recunoasterea formelor are ca obiect clasificarea unui set (multime) de obiecte, procese sau evenimente, indiferent care ar fi natura lor. De exemplu, acestea pot fi obiecte si fenomene fizice sau stari fiziologice si mintale. Setul de masuratori indirecte cu ajutorul careia este descris sau caracterizat un obiect poarta numele de forma. Numarul de tipuri (clase) de forme este determinat de aplicatia concreta, particulara. Astfel, daca de exemplu se pune problema recunoasterii caracterelor alfabetice (alfabetul roman) vom avea o problema de clasificare cu 27 de clase, pe cand in cazul in care se urmareste discriminarea intre caracterele latine si cele chirilice problema de clasificare va avea doar doua clase. De fapt clasificarea formelor constituie un proces fundamental care apare atat in cadrul activitatilor umane curente cat si in majoritatea ramurilor stiintei.

Modelele matematice utilizate pentru rezolvarea problemelor de recunoastere a formelor pot fi grupate in doua mari categorii:

metode teoretice-decizionale (sau statistice)

metode sintactice (sau lingvistice).

In cazul metodelor teoretice-decizionale procesul de clasificare se bazeaza pe un set de masuratori selectate din forma de intrare, numite caracteristici.

In cazul metodelor sintactice de recunoastere a formelor, numita uneori si recunoastere structurala, procesul de clasificare tine cont si de informatia structurala care caracterizeaza fiecare forma. Ca urmare procesul de recunoastere nu se limiteaza doar la clasificarea formei respective ci el include si metode capabile sa descrie acele aspecte ale formelor care le fac sa nu poata fi atribuite altor clase.

Recunoasterea formelor consta din urmatoarele doua aspecte importante:

Extragerea caracteristicilor esentiale pentru procesul particular de clasificare. In mod obisnuit decizia care se ia in aceasta etapa este relativ subiectiva si depinde de considerente practice cum ar fi: accesibilitatea executiei masuratorilor, costul acestora, etc. Din nefericire, la ora actuala nu exista o teorie cat de putin generala asupra procesului de selectie a celor mai reprezentative caracteristici. Criteriile care stau la baza procesului de selectare a caracteristicilor si de ordonare a acestora se bazeaza fie pe importanta lor in caracterizarea formelor, fie pe contributiile pe care le aduc la performantele recunoasterii (de exemplu acuratetea clasificarii).

Clasificarea propriu-zisa, adica luarea deciziei privind apartenenta formelor la o clasa. Metodele matematice folosite in acest scop sunt adeseori denumite clasificatori. In figura Fig.2.1. prezentam schema bloc a unui sistem de recunoastere a formelor.

Fig 2.1. Schema bloc a unui sistem de recunoastere a formelor.

Din figura se observa existenta unei reactii utilizate pentru reluarea procesului de selectare a caracteristicilor si clasificare pana cand este indeplinit un anumit criteriu ales de utilizator.

Metode teoretice decizionale

Sunt cunoscute doua moduri de abordare a procesului de recunoastere a formelor. Primul mod cunoscut sub numele de recunoastere controlata presupune existenta unui set de forme a caror apartenenta la clasa este cunoscuta. Acest set este impartit in doua parti: setul de formare utilizat pentru a dezvolta un clasificator (ce utilizeaza, de exemplu, matricea distantelor dintre forme) care sa recunoasca cat mai bine apartenenta formelor din set la clasele corespunzatoare si setul de predictie pe care clasificatorul format este evaluat (testat). Clasificatorul astfel dezvoltat este utilizat in continuare pentru stabilirea apartenentei unei forme necunoscute la o clasa.

Cel de-al doilea mod cunoscut sub numele de recunoastere necontrolata nu face apel la o cunoastere prealabila a apartenentei formelor la o clasa. Metoda dezvolta algoritmi care permit in cursul executiei acestora construirea claselor pe masura ce formele analizate sunt luate in considerare.

Un caz particular al metodelor teoretice decizionale il constituie tehnicile de invatare. Acestea utilizeaza un set de forme a caror apartenenta la clase este cunoscuta. Setul este utilizat in mod iterativ de un algoritm care construieste coeficientii clasificatorului, corespunzator tipului de problema (fara a utiliza matricea distantelor dintre forme).

Vectori de forma si spatiul formelor

Fiecare caracteristica poate fi considerata ca fiind o variabila intr-un spatiu n-dimensional unde fiecare caracteristica este atribuita unei dimensiuni. Fiecare forma apare ca un punct in spatiul formelor. Cand o forma este descrisa de mai multe caracteristici ea poate fi privita ca un vector X, denumit vectorul de forma. Acest vector este dat de relatia:

(2.1)

unde x_i, i= 1,., n reprezinta cele n caracteristici.

Spatiul formelor notat cu W_X poate fi descris cu ajutorul relatiei

(2.2)

unde X^'_i desemneaza vectorul transpus a lui X, iar m numarul de forme.

Tehnici de decizie si clasificare

Conceptul de clasificare al formelor poate fi inteles ca o partitionare a spatiului caracteristicilor acestuia. Clasificarea formelor, adica atribuirea fiecarui vector posibil sau punct din spatiul caracteristicilor clasei din care face parte, poate fi interpretata ca o partitionare a acestuia in regiuni (domenii) reciproc exclusive, fiecare domeniu apartinand unei clase de forme particulare. Din punct de vedere matematic acest gen de problema de clasificare poate fi definita sub forma unei functii discriminant. Astfel fie w w w_m cele m clase de forme posibile cu proprietatile:

w w .w_m W_X (2.3)

w₁ w _.w_m = F.

Unde cu F s-a notat multimea care constituie frontierele dintre clase, iar cu X s-a notat vectorul de forma. In acest caz functia discriminant D_j(X) asociata clasei de forme w_j,j =1,., m are proprietatea ca daca forma reprezentata prin vectorul X face parte din w_i, fapt pe care-l vom simboliza X w_i, cu i specificat, atunci valoarea lui D_i(X) trebuie sa fie cea mai mare, adica pentru toti X w_i va fi indeplinita conditia

D_i(X) > D_j(X); i,j = 1, ., m, i¹j. (2.4)

In felul acesta limitele de partitionare ale spatiului caracteristicilor (desemnate anterior cu F), denumite si limite de decizie, pot fi exprimate cu ajutorul relatiei

F = D_i(X) - D_j(X) = 0; i, j=1,.,m, i¹j

Au fost propuse foarte multe forme pentru functii discriminant D_i(X), forme ce satisfac conditia (2.4). dintre acestea vom mentiona in continuare doar pe cele mai importante.

Functii discriminant liniare

Intr-un spatiu bidimensional aceste functii sunt liniare si pot fi scrise sub forma:

x₁-mx₂-b=0,

W₁x₁+W₂x₂+W₃x₃=0 (2.6)

unde:

m - este coeficientul unghiular,

b - termenul liber,

iar W₁= 1, W₂= -m si W₃= -b.

Intr-un spatiu n- dimensional functiile sunt hiperplane de forma:

W₁x₁+W₂x₂+..+W_nx_n+W_n+1= 0 (2.7)

In acest caz functia discriminant D_i(X) asociata clasei de forme w_i reprezinta o combinatie liniara a caracteristicilor x_i, i =1,.,m, data in relatia:

D_i(X)= W_i,kx_k+ W_i,n+1 , I =1,.,m (2.8)

Ecuatiile hiperplanelor date de relatia (1.8), pentru m clase de forme, pot fi scrise matriceal astfel:

D(X)=

Unde:

si (2.9)

In vectorul X s-a introdus suplimentar termenul 1 pentru a da posibilitatea efectuarii operatiei de inmultire.

Limita de decizie dintre regiunile W_x corespunzatoare claselor w_i si w_j este de forma:

D_i(X) - D_j(X) = W_kx_k+W_n+1 ; k = 1n; (2.10)

unde:

W_k=W_i,k - W_j,k

W_n+1=W_i,n+1-W_j,n+1.

Ecuatia (2.10) reprezinta ecuatia unui hiperplan din spatiul caracteristicilor W_x, numit si plan de decizie. Pentru a ilustra modul de utilizare a functiilor discriminant liniare prezentam un exemplu in care avem doua forme intr-un spatiu bi-dimensional. Fie formele X₁ si X₂ date de:

si functia de decizie D(X) = 0 data de relatia:

Relatia de mai sus poate fi scrisa sub forma:

Daca inlocuim pe X₁ si X2 in D(X), obtinem:

si respectiv

Pentru orice punct aflat deasupra lui D(X) = 0, D(X) este pozitiv si negativ pentru punctele de sub dreapta. Astfel, pentru cazul a doua clase, polaritatea in evaluarea lui D(X) determina la care clasa apartine forma data (Fig. 1.2-1).

Fig. 2.2‑ Functia de decizie liniara in doua dimensiuni.

In cazul in care este necesara discriminarea pentru mai mult de doua forme sunt necesare doua sau mai multe functii de decizie. Pentru aceasta situatie exista trei tipuri de clasificatori.

i) Tipul 1 utilizeaza o functie de decizie care imparte spatiul formelor in doua clase. Prima clasa notata cu w_i contine o singura forma, iar cea de a doua clasa contine restul formelor. Pentru a asigura apartenenta unei forme la clasa w_i este suficient sa fie indeplinita conditia D_i(X)>0 si D_j(X)<0 pentru toti i, j. Pentru n clase sunt necesare n functii de decizie.

ii) Tipul 2 utilizeaza functii de decizie care separa spatiul formelor in doua regiuni. Prima regiune contine doua clase, iar cea de-a doua restul claselor. Separarea celor doua clase w_i si w_j se face cu ajutorul unei functii de decizie de forma D_ij(X) = 0. Apartenenta unei forme la clasa w_i sau w_j este asigurata daca D_ij(X) > 0.

iii) Tipul 3 reprezinta un caz special al tipului 2 de clasificare. Din analiza figurilor 2.2-2a si 2.2-2b se observa prezenta unui spatiu nedeterminat care apare in interiorul triunghiului format din cele trei drepte corespunzatoare functiei de decizie. Punctele din interiorul acestui triunghi nu pot fi atribuite la nici una din cele trei clase. Pentru a elimina aceasta nedeterminare, functia de decizie de tipul 2, D_ij(X) = 0 este inlocuita cu D_i(X)-D_j(X) = 0, unde D_i(X) si D_j(X) sunt functii de decizie de tipul 1. Pentru ca o forma sa fie atribuita clasei w_i este necesar, in acest caz, indeplinirea conditiei D_i(X)>D_j(X) pentru toti j¹i (vezi fig. 2.2-2c).

Fig. 2.2‑ Functii de decizie multi-categorie: a-tipul 1; b-tipul 2; c-tipul 3.

Daca clasele pot fi separate utilizand tipul 1 de clasificare, regiunile in care este prezenta clasele vor fi mai compacte, fapt care conduce la o mai buna identificare a claselor decat in cazul utilizarii tipului 2 sau 3 de clasificare. In schimb, insa, regiunea de nedeterminare este mare. Daca in aplicatia practica apar forme in regiunea de nedeterminare rezultate in urma aplicarii tipului 1 de clasificare, poate fi incercata utilizarea tipului 2 de clasificare, in care regiunea de nedeterminare este mai mica sau a tipului 3 (tipul 3 de clasificare are dezavantajul ca timpul de calcul este mare)

Clasificatorul de distanta minima

O importanta clasa de clasificatori se bazeaza pe valoarea distantelor dintre forma de intrare si un set de vectori de referinta sau puncte prototip din spatiul caracteristicilor (prototipurile sunt forme a caror apartenenta la clase este cunoscuta). Daca vom presupune ca sunt cunoscuti m vectori de referinta, notati cu R₁, R₂,.R_m, cu R_j asociat clasei w_j , atunci clasificatorul de distanta minima va atribui forma de intrare X clasei w_i daca distanta dintre aceasta si vectorii de referinta este minima,

adica X w_i daca d = X-R_i = minim. (2.11)

Consideram doua grupe de puncte distincte in spatiul formelor si ne propunem sa determinam functia de decizie care va putea separa spatiul formelor in doua regiuni care vor corespunde celor doua clase. Initial vom determina vectorii de referinta pe care ii vom considera reprezentand centrele celor doua grupari de puncte. Valoarea punctelor prototip poate fi calculata cu o relatie de forma :

(2.12)

unde N reprezinta numarul de forme dintr-o grupare. Distanta dintre o forma X si centrul gruparii R (R este de forma R = (r₁, r₂,.,r_m)) este data de relatia d = X-R . Daca consideram ca cele doua grupari se afla intr-un spatiu bi-dimensional, atunci d va avea urmatoarea forma :

d²= (x₁- r₁)²+(x₂- r₂)²= x₁²- 2x₁r₁+ r₁²+ x₂²- 2x₂r₂+ r₂².

In cazul cand avem mai mult de doua clase, distanta dintre o forma X si R_i al gruparii i este data de :

(2.13)

Deoarece este aceeasi pentru toate clasele, el poate fi eliminat. Daca inmultim relatia (1.13) cu -0.5, vom obtine :

(2.14)

Deoarece d_i² a fost inmultit cu un numar negativ rezulta ca cea mai mare functie de decizie (max D_i(X)) identifica distanta minima si deci clasa lui X.

Pentru determinarea termenilor W, din functia de decizie se utilizeaza relatia (2.14) si rezulta , pentru i = 1,.., n si .

Din cele spuse anterior rezulta ca un clasificator de distanta minima este un clasificator liniar. Performanta unui astfel de clasificator depinde evident de modul cum sunt alesi vectorii de referinta dar si de felul cum sunt evaluate distantele. Cele mai frecvente distante utilizate sunt cele derivate de distanta generala Minkovski.

(2.15)

Astfel, pentru k = 2 se obtine binecunoscuta distanta Euclidiana.

(2.16)

Pentru k = 1 se obtine distanta Manhattan.

(2.17)

Daca toate caracteristicile x_i si r_i, i =1,.,n sunt codificate binar (au doar valorile 0 sau 1), atunci distanta Manhattan poarta numele de distanta Hamming. Distanta Hamming este echivalenta cu numarul de caracteristici care sunt diferite in X si R. Aplicarea lui SAU EXCLUSIV, simbolizat aici prin XOR, permite calcului foarte rapid al distantei Hamming conform relatiei:

(1.18)

Alte tipuri de clasificatori

In literatura de specialitate sunt dezvoltati un numar mare de clasificatori, majoritatea avand ca punct de plecare clasificatorul distantei minime prezentat anterior. Dintre acestia cei mai importanti sunt:

i) Clasificatorul vecinului cel mai apropiat. Acesta dezvolta un clasificator de distanta minima in raport cu mai multe seturi de vectori de referinta. Astfel, fie R₁, .,R_m cele m seturi de vectori prototip asociate, respectiv, claselor w w_m si R_j^(k) setul de vectori de referinta din setul R_j, care apartin clasei w_j. In acest caz distanta dintre forma de intrare reprezentata prin vectorul X si setul de vectori de referinta R_j se defineste astfel:

j = 1,.,m (2.19)

U_j fiind numarul de vectori de referinta din setul R_j. Clasificatorul ce utilizeaza acest tip de distanta va fi de forma

i =1, ., m (2.20)

Acesti clasificatori sunt adesea denumiti clasificatori liniari pe portiuni sau clasificatori bazati pe cei mai apropiati U vecini.

ii) Functii discriminant polinomiale.

Acestea dezvolta un clasificator de forma:

(2.21)

unde:

k₁, k₂,..k_r= 1,.,n

pentru si

n₁, n₂,.,n_r= 0 si 1.

Limita de decizie dintre oricare 2 clase are forma unui polinom de ordinul r. In mod particular, pentru r = 2 obtinem o functie discriminant patrata cu

pentru k₁, k₂= 1,.,n; n₁, n₂= 0 si 1 (2.22)

si L = (1/2) n (n+3).

In aceasta situatie limita de decizie este un hiper-hiperboloid (in unele cazuri speciale aceste limite pot fi hipersfere sau hiperelipsoizi).

iii) Clasificatorul Bayes

Se foloseste atunci cand distributia formelor nu este total disjuncta si exista suprapuneri semnificative ale valorilor trasaturilor diferitelor clase de forme.

In abordarea Bayesiana se folosesc cunostinte probabilistice despre trasaturile formelor si despre frecventa lor de aparitie.

Se presupune ca probabilitatea formelor clasei w_i este P(w_i Acesta inseamna ca apriori cunoastem probabilitatea de aparitie a unei forme din clasa w_I si, in absenta oricaror alte cunostinte, putem minimiza probabilitatea erorii de decizie presupunand ca forma necunoscuta apartine clasei cu probabilitatea P(w_i maxima. In luarea unei decizii de apartenenta se tine seama si de observatii asupra formelor.

Comportarea unei clase de forme este descrisa de probabilitatea conditionata p(x/w_i Probabilitatea p(x/w_i ne spune ca o trasatura masurata a unei forme apartinand clasei w_I are valoarea x cu probabilitatea p(x/w_I Bazat pe aceste cunostinte se poate calcula probabilitatea a posteriori p(w_j /x) pentru o forma necunoscuta. Probabilitatea a posteriori p(w_j /x) a unei forme necunoscute ne spune ca daca o masuratoare facuta asupra formei necunoscute are valoarea x forma apartine clasei w_j cu probabilitatea p(w_j /x). Calculul probabilitati conditionate p(w_j /x) se face pe baza formulei lui Bayes:

(2.23)

unde:

m reprezinta numarul de clase.

Forma necunoscuta trebuie asignata clasei cu p(w_j /x) maxim. Formula poate fi generalizata pentru cazul unor vectori de trasaturi n dimensionali.

(2.24)

unde:

X este vectorul de forma n-dimensional.

Clasificarea Bayes este de forma:

D_i(X) = P(w_i)*p(X/w_i i =1,.,n (2.25)

Recunoasterea necontrolata. Tehnici de grupare

Tehnicile de grupare consta dintr-un set de algoritmi care asigura impartirea spatiului formelor in clase, grupe de forme, fara a face apel la existenta prealabila a unui set de predictie cunoscut. Conceptul de grupare poate fi inteles cel mai bine prin prezentarea celui mai simplu algoritm de grupare (denumit algoritm de tip prag). Algoritmul presupune existenta in spatiul formelor a unui set de forme si stabilirea initiala a unei distante minime (numita distanta de prag) dintre doua forme. Daca distanta dintre doua forme este mai mica decat distanta de prag, cele doua forme fac parte din aceeasi clasa. Notam cu T distanta prag. Initial se stabileste aleatoriu un prim centru de grup pe care-l notam cu Z₁(Z₁ corespunde cu una din cele N forme). Se calculeaza distanta dintre acest centru si toate celelalte forme. Daca distantele calculate sunt mai mici decat T, formele respective sunt atribuite clasei w , a carei centru este Z₁. Prima forma situata la o distanta mai mare decat T conduce la crearea unei noi grupari (clase) w_i cu centrul definit de forma respectiva. Se reia calculul distantelor pentru formele ramase, luand in considerare noua grupare creata.

Procesul de obtinere de noi grupari si de atribuire a formelor la aceste grupari continua pana in momentul in care sunt clasificate toate formele. Algoritmul este prezentat in figura Fig. 2.3-1.

Fig. 2.3‑ Algoritm de tip prag.

Studiind acest algoritm pot fi determinate o serie de caracteristici ale tehnicilor de grupare.

Alegerea centrelor claselor (gruparilor)

Modul de alegere afecteaza viteza de clasificare ca si numarul de grupe (clase) care rezulta in urma executarii procedurii de clasificare. Din acest motiv se recurge, de obicei, la calculul continuu a unui centru al clasei pe masura ce la acesta se atribuie noi forme. In acest caz, centrul gruparii poate sa nu corespunda cu o forma existenta.

Alegerea criteriului de clasificare.

In cazul exemplului dat, criteriul de clasificare este o distanta. Se observa ca valoarea lui T afecteaza rezolutia procesului de clasificare. Daca T este prea mare, doua sau mai multe clase distincte pot fi grupate in una singura. In cazul in care T este prea mic, o grupare poate fi impartita in mod artificial in cateva grupe. Pentru determinarea valori lui T se tine cont de efectul pe care-l va avea aceasta valoare asupra numarului de grupari. In cazul general se utilizeaza criteriile de similaritate si nesimilaritate prin care se asigura apartenenta unei forme la o clasa. Acestea pot fi distante sau alti parametri.

In figura Fig 2.3-2 se prezinta un algoritm general de grupare care ia in considerare criteriile de grupare specificate anterior.

Fig. 2.3‑ Algoritm de grupare

Tehnici de invatare

Aceste tehnici dezvolta algoritmi prin care sunt construiti coeficientii functiei de decizie utilizand o metoda tip 'feed-back'. Algoritmii opereaza asupra unui set de forme a caror apartenenta la clasa este cunoscuta. Determina coeficientii functiei de decizie conform unuia din cele trei criterii de clasificare (specificate anterior), interativ, pana la satisfacerea conditiilor impuse.

Pentru a ilustra cele mentionate presupunem un set de N forme impartit in doua clase w si w. Ne propunem sa determinam coeficientii vectorului pondere W. Functia de decizie data de relatia (1.9), pentru un spatiu n-dimensional, are forma

D(X)=[W₁, .,W_n,W_n+1]X, unde X=[x_1I,x_2I] pentru i=1,.,n.

Pentru formele x_1i aprtine w, functia de decizie este pozitiva si negativa daca x_2I apartine w (vezi paragraful 1.2.2.a). Prin urmare criteriul care se urmareste a fi atins este D(X)>0. Algoritmul alege o forma si calculeaza functia sa de decizie. Daca D(X)>0, vectorul pondere este satisfacator si nu se modifica. Se trece la urmatoarea forma. Daca D(X)<0, vectorul de ponderi trebuie sa fie modificat astfel incat functia de decizie sa devina pozitiva. Daca aceasta conditie a fost indeplinita pentru toate formele din clasa w se repeta operatia pentru formele din clasa w (care au fost inmultite in prealabil cu -1 pentru ca functia de decizie sa fie pozitiva). Operatia presupune:

i) stabilirea unei valori initiale pentru vectorul de ponderi;

ii) stabilirea unei modalitati de modificare a lui W.

Politica de confidentialitate | Termeni si conditii de utilizare

DISTRIBUIE DOCUMENTUL

Vizualizari: 1727
Importanta:

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Distribuie URL
https://www.scrigroup.com/educatie/matematica/Principiile-generale-ale-tehni93914.php

Adauga cod HTML in site
<a href="https://www.scrigroup.com/educatie/matematica/Principiile-generale-ale-tehni93914.php" target="_blank" title=" - https://www.scrigroup.com/educatie/matematica/Principiile-generale-ale-tehni93914.php">Principiile generale ale tehnicilor de recunoastere a formelor</a>