Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
AstronomieBiofizicaBiologieBotanicaCartiChimieCopii
Educatie civicaFabule ghicitoriFizicaGramaticaJocLiteratura romanaLogica
MatematicaPoeziiPsihologie psihiatrieSociologie


Principiile generale ale tehnicilor de recunoastere a formelor

Matematica



+ Font mai mare | - Font mai mic



Principiile generale ale tehnicilor de recunoastere a formelor

Introducere

Recunoasterea formelor are ca obiect clasificarea unui set (multime) de obiecte, procese sau evenimente, indiferent care ar fi natura lor. De exemplu, acestea pot fi obiecte si fenomene fizice sau stari fiziologice si mintale. Setul de masuratori indirecte cu ajutorul careia este descris sau caracterizat un obiect poarta numele de forma. Numarul de tipuri (clase) de forme este determinat de aplicatia concreta, particulara. Astfel, daca de exemplu se pune problema recunoasterii caracterelor alfabetice (alfabetul roman) vom avea o problema de clasificare cu 27 de clase, pe cand in cazul in care se urmareste discriminarea intre caracterele latine si cele chirilice problema de clasificare va avea doar doua clase. De fapt clasificarea formelor constituie un proces fundamental care apare atat in cadrul activitatilor umane curente cat si in majoritatea ramurilor stiintei.



Modelele matematice utilizate pentru rezolvarea problemelor de recunoastere a formelor pot fi grupate in doua mari categorii:

metode teoretice-decizionale (sau statistice)

metode sintactice (sau lingvistice).

In cazul metodelor teoretice-decizionale procesul de clasificare se bazeaza pe un set de masuratori selectate din forma de intrare, numite caracteristici.

In cazul metodelor sintactice de recunoastere a formelor, numita uneori si recunoastere structurala, procesul de clasificare tine cont si de informatia structurala care caracterizeaza fiecare forma. Ca urmare procesul de recunoastere nu se limiteaza doar la clasificarea formei respective ci el include si metode capabile sa descrie acele aspecte ale formelor care le fac sa nu poata fi atribuite altor clase.

Recunoasterea formelor consta din urmatoarele doua aspecte importante:

Extragerea caracteristicilor esentiale pentru procesul particular de clasificare. In mod obisnuit decizia care se ia in aceasta etapa este relativ subiectiva si depinde de considerente practice cum ar fi: accesibilitatea executiei masuratorilor, costul acestora, etc. Din nefericire, la ora actuala nu exista o teorie cat de putin generala asupra procesului de selectie a celor mai reprezentative caracteristici. Criteriile care stau la baza procesului de selectare a caracteristicilor si de ordonare a acestora se bazeaza fie pe importanta lor in caracterizarea formelor, fie pe contributiile pe care le aduc la performantele recunoasterii (de exemplu acuratetea clasificarii).

Clasificarea propriu-zisa, adica luarea deciziei privind apartenenta formelor la o clasa. Metodele matematice folosite in acest scop sunt adeseori denumite clasificatori. In figura Fig.2.1. prezentam schema bloc a unui sistem de recunoastere a formelor.

Fig 2.1. Schema bloc a unui sistem de recunoastere a formelor.

Din figura se observa existenta unei reactii utilizate pentru reluarea procesului de selectare a caracteristicilor si clasificare pana cand este indeplinit un anumit criteriu ales de utilizator.

Metode teoretice decizionale

Sunt cunoscute doua moduri de abordare a procesului de recunoastere a formelor. Primul mod cunoscut sub numele de recunoastere controlata presupune existenta unui set de forme a caror apartenenta la clasa este cunoscuta. Acest set este impartit in doua parti: setul de formare utilizat pentru a dezvolta un clasificator (ce utilizeaza, de exemplu, matricea distantelor dintre forme) care sa recunoasca cat mai bine apartenenta formelor din set la clasele corespunzatoare si setul de predictie pe care clasificatorul format este evaluat (testat). Clasificatorul astfel dezvoltat este utilizat in continuare pentru stabilirea apartenentei unei forme necunoscute la o clasa.

Cel de-al doilea mod cunoscut sub numele de recunoastere necontrolata nu face apel la o cunoastere prealabila a apartenentei formelor la o clasa. Metoda dezvolta algoritmi care permit in cursul executiei acestora construirea claselor pe masura ce formele analizate sunt luate in considerare.

Un caz particular al metodelor teoretice decizionale il constituie tehnicile de invatare. Acestea utilizeaza un set de forme a caror apartenenta la clase este cunoscuta. Setul este utilizat in mod iterativ de un algoritm care construieste coeficientii clasificatorului, corespunzator tipului de problema (fara a utiliza matricea distantelor dintre forme).

Vectori de forma si spatiul formelor

Fiecare caracteristica poate fi considerata ca fiind o variabila intr-un spatiu n-dimensional unde fiecare caracteristica este atribuita unei dimensiuni. Fiecare forma apare ca un punct in spatiul formelor. Cand o forma este descrisa de mai multe caracteristici ea poate fi privita ca un vector X, denumit vectorul de forma. Acest vector este dat de relatia:

(2.1)

unde xi, i= 1,., n reprezinta cele n caracteristici.

Spatiul formelor notat cu WX poate fi descris cu ajutorul relatiei

(2.2)

unde X'i desemneaza vectorul transpus a lui X, iar m numarul de forme.

Tehnici de decizie si clasificare

Conceptul de clasificare al formelor poate fi inteles ca o partitionare a spatiului caracteristicilor acestuia. Clasificarea formelor, adica atribuirea fiecarui vector posibil sau punct din spatiul caracteristicilor clasei din care face parte, poate fi interpretata ca o partitionare a acestuia in regiuni (domenii) reciproc exclusive, fiecare domeniu apartinand unei clase de forme particulare. Din punct de vedere matematic acest gen de problema de clasificare poate fi definita sub forma unei functii discriminant. Astfel fie w w wm cele m clase de forme posibile cu proprietatile:

w w .wm WX (2.3)

si

w1 w .wm = F.

Unde cu F s-a notat multimea care constituie frontierele dintre clase, iar cu X s-a notat vectorul de forma. In acest caz functia discriminant Dj(X) asociata clasei de forme wj, j =1,., m are proprietatea ca daca forma reprezentata prin vectorul X face parte din wi, fapt pe care-l vom simboliza X wi, cu i specificat, atunci valoarea lui Di(X) trebuie sa fie cea mai mare, adica pentru toti X wi va fi indeplinita conditia

Di(X) > Dj(X);     i,j = 1, ., m, i¹j. (2.4)

In felul acesta limitele de partitionare ale spatiului caracteristicilor (desemnate anterior cu F), denumite si limite de decizie, pot fi exprimate cu ajutorul relatiei

F = Di(X) - Dj(X) = 0; i, j=1,.,m, i¹j

Au fost propuse foarte multe forme pentru functii discriminant Di(X), forme ce satisfac conditia (2.4). dintre acestea vom mentiona in continuare doar pe cele mai importante.

Functii discriminant liniare

Intr-un spatiu bidimensional aceste functii sunt liniare si pot fi scrise sub forma:

x1-mx2-b=0,

sau

W1x1+W2x2+W3x3=0    (2.6)

unde:

m - este coeficientul unghiular,

b - termenul liber,

iar W1= 1, W2= -m si W3= -b.

Intr-un spatiu n- dimensional functiile sunt hiperplane de forma:

W1x1+W2x2+..+Wnxn+Wn+1= 0 (2.7)

In acest caz functia discriminant Di(X) asociata clasei de forme wi reprezinta o combinatie liniara a caracteristicilor xi, i =1,.,m, data in relatia:

Di(X)= Wi,kxk+ Wi,n+1 , I =1,.,m (2.8)

Ecuatiile hiperplanelor date de relatia (1.8), pentru m clase de forme, pot fi scrise matriceal astfel:

D(X)=

Unde:

si (2.9)

In vectorul X s-a introdus suplimentar termenul 1 pentru a da posibilitatea efectuarii operatiei de inmultire.

Limita de decizie dintre regiunile Wx corespunzatoare claselor wi si wj este de forma:

Di(X) - Dj(X) = Wkxk+Wn+1 ; k = 1n; (2.10)

unde:

Wk=Wi,k - Wj,k

si

Wn+1=Wi,n+1-Wj,n+1.

Ecuatia (2.10) reprezinta ecuatia unui hiperplan din spatiul caracteristicilor Wx, numit si plan de decizie. Pentru a ilustra modul de utilizare a functiilor discriminant liniare prezentam un exemplu in care avem doua forme intr-un spatiu bi-dimensional. Fie formele X1 si X2 date de:

si

si functia de decizie D(X) = 0 data de relatia:

Relatia de mai sus poate fi scrisa sub forma:

Daca inlocuim pe X1 si X2 in D(X), obtinem:

si respectiv

Pentru orice punct aflat deasupra lui D(X) = 0, D(X) este pozitiv si negativ pentru punctele de sub dreapta. Astfel, pentru cazul a doua clase, polaritatea in evaluarea lui D(X) determina la care clasa apartine forma data (Fig. 1.2-1).

Fig. 2.2‑ Functia de decizie liniara in doua dimensiuni.

In cazul in care este necesara discriminarea pentru mai mult de doua forme sunt necesare doua sau mai multe functii de decizie. Pentru aceasta situatie exista trei tipuri de clasificatori.

i)            Tipul 1 utilizeaza o functie de decizie care imparte spatiul formelor in doua clase. Prima clasa notata cu wi contine o singura forma, iar cea de a doua clasa contine restul formelor. Pentru a asigura apartenenta unei forme la clasa wi este suficient sa fie indeplinita conditia Di(X)>0 si Dj(X)<0 pentru toti i, j. Pentru n clase sunt necesare n functii de decizie.

ii)           Tipul 2 utilizeaza functii de decizie care separa spatiul formelor in doua regiuni. Prima regiune contine doua clase, iar cea de-a doua restul claselor. Separarea celor doua clase wi si wj se face cu ajutorul unei functii de decizie de forma Dij(X) = 0. Apartenenta unei forme la clasa wi sau wj este asigurata daca Dij(X) > 0.

iii)         Tipul 3 reprezinta un caz special al tipului 2 de clasificare. Din analiza figurilor 2.2-2a si 2.2-2b se observa prezenta unui spatiu nedeterminat care apare in interiorul triunghiului format din cele trei drepte corespunzatoare functiei de decizie. Punctele din interiorul acestui triunghi nu pot fi atribuite la nici una din cele trei clase. Pentru a elimina aceasta nedeterminare, functia de decizie de tipul 2, Dij(X) = 0 este inlocuita cu Di(X)-Dj(X) = 0, unde Di(X) si Dj(X) sunt functii de decizie de tipul 1. Pentru ca o forma sa fie atribuita clasei wi este necesar, in acest caz, indeplinirea conditiei Di(X)>Dj(X) pentru toti j¹i (vezi fig. 2.2-2c).

Fig. 2.2Functii de decizie multi-categorie: a-tipul 1; b-tipul 2; c-tipul 3.

Daca clasele pot fi separate utilizand tipul 1 de clasificare, regiunile in care este prezenta clasele vor fi mai compacte, fapt care conduce la o mai buna identificare a claselor decat in cazul utilizarii tipului 2 sau 3 de clasificare. In schimb, insa, regiunea de nedeterminare este mare. Daca in aplicatia practica apar forme in regiunea de nedeterminare rezultate in urma aplicarii tipului 1 de clasificare, poate fi incercata utilizarea tipului 2 de clasificare, in care regiunea de nedeterminare este mai mica sau a tipului 3 (tipul 3 de clasificare are dezavantajul ca timpul de calcul este mare)

Clasificatorul de distanta minima

O importanta clasa de clasificatori se bazeaza pe valoarea distantelor dintre forma de intrare si un set de vectori de referinta sau puncte prototip din spatiul caracteristicilor (prototipurile sunt forme a caror apartenenta la clase este cunoscuta). Daca vom presupune ca sunt cunoscuti m vectori de referinta, notati cu R1, R2,.Rm, cu Rj asociat clasei wj , atunci clasificatorul de distanta minima va atribui forma de intrare X clasei wi daca distanta dintre aceasta si vectorii de referinta este minima,

adica X wi daca d = X-Ri = minim.    (2.11)

Consideram doua grupe de puncte distincte in spatiul formelor si ne propunem sa determinam functia de decizie care va putea separa spatiul formelor in doua regiuni care vor corespunde celor doua clase. Initial vom determina vectorii de referinta pe care ii vom considera reprezentand centrele celor doua grupari de puncte. Valoarea punctelor prototip poate fi calculata cu o relatie de forma :

(2.12)

unde N reprezinta numarul de forme dintr-o grupare. Distanta dintre o forma X si centrul gruparii R (R este de forma R = (r1, r2,.,rm)) este data de relatia d = X-R . Daca consideram ca cele doua grupari se afla intr-un spatiu bi-dimensional, atunci d va avea urmatoarea forma :

d2 = (x1 - r1)+(x2 - r2)2 = x12 - 2x1r1 + r12 + x22 - 2x2r2 + r22.

In cazul cand avem mai mult de doua clase, distanta dintre o forma X si Ri al gruparii i este data de :

(2.13)

Deoarece     este aceeasi pentru toate clasele, el poate fi eliminat. Daca inmultim relatia (1.13) cu -0.5, vom obtine :

(2.14)

Deoarece di2 a fost inmultit cu un numar negativ rezulta ca cea mai mare functie de decizie (max Di(X)) identifica distanta minima si deci clasa lui X.

Pentru determinarea termenilor W, din functia de decizie se utilizeaza relatia (2.14) si rezulta , pentru i = 1,.., n si .

Din cele spuse anterior rezulta ca un clasificator de distanta minima este un clasificator liniar. Performanta unui astfel de clasificator depinde evident de modul cum sunt alesi vectorii de referinta dar si de felul cum sunt evaluate distantele. Cele mai frecvente distante utilizate sunt cele derivate de distanta generala Minkovski.

(2.15)

Astfel, pentru k = 2 se obtine binecunoscuta distanta Euclidiana.

(2.16)

Pentru k = 1 se obtine distanta Manhattan.

(2.17)

Daca toate caracteristicile xi si ri, i =1,.,n sunt codificate binar (au doar valorile 0 sau 1), atunci distanta Manhattan poarta numele de distanta Hamming. Distanta Hamming este echivalenta cu numarul de caracteristici care sunt diferite in X si R. Aplicarea lui SAU EXCLUSIV, simbolizat aici prin XOR, permite calcului foarte rapid al distantei Hamming conform relatiei:

(1.18)

Alte tipuri de clasificatori

In literatura de specialitate sunt dezvoltati un numar mare de clasificatori, majoritatea avand ca punct de plecare clasificatorul distantei minime prezentat anterior. Dintre acestia cei mai importanti sunt:

i)            Clasificatorul vecinului cel mai apropiat. Acesta dezvolta un clasificator de distanta minima in raport cu mai multe seturi de vectori de referinta. Astfel, fie R1, .,Rm cele m seturi de vectori prototip asociate, respectiv, claselor w wm si Rj(k) setul de vectori de referinta din setul Rj, care apartin clasei wj. In acest caz distanta dintre forma de intrare reprezentata prin vectorul X si setul de vectori de referinta Rj se defineste astfel:

j = 1,.,m (2.19)

Uj fiind numarul de vectori de referinta din setul Rj. Clasificatorul ce utilizeaza acest tip de distanta va fi de forma

i =1, ., m (2.20)

Acesti clasificatori sunt adesea denumiti clasificatori liniari pe portiuni sau clasificatori bazati pe cei mai apropiati U vecini.

ii)           Functii discriminant polinomiale.

Acestea dezvolta un clasificator de forma:

(2.21)

unde:    

k1, k2,..kr = 1,.,n

pentru si

n1, n2,.,nr = 0 si 1.

Limita de decizie dintre oricare 2 clase are forma unui polinom de ordinul r. In mod particular, pentru r = 2 obtinem o functie discriminant patrata cu

pentru k1, k2= 1,.,n; n1, n2 = 0 si 1 (2.22)

si L = (1/2) n (n+3).

In aceasta situatie limita de decizie este un hiper-hiperboloid (in unele cazuri speciale aceste limite pot fi hipersfere sau hiperelipsoizi).

iii)         Clasificatorul Bayes

Se foloseste atunci cand distributia formelor nu este total disjuncta si exista suprapuneri semnificative ale valorilor trasaturilor diferitelor clase de forme.

In abordarea Bayesiana se folosesc cunostinte probabilistice despre trasaturile formelor si despre frecventa lor de aparitie.

Se presupune ca probabilitatea formelor clasei wi este P(wi Acesta inseamna ca apriori cunoastem probabilitatea de aparitie a unei forme din clasa wI si, in absenta oricaror alte cunostinte, putem minimiza probabilitatea erorii de decizie presupunand ca forma necunoscuta apartine clasei cu probabilitatea P(wi maxima. In luarea unei decizii de apartenenta se tine seama si de observatii asupra formelor.

Comportarea unei clase de forme este descrisa de probabilitatea conditionata p(x/wi Probabilitatea p(x/wi ne spune ca o trasatura masurata a unei forme apartinand clasei wI are valoarea x cu probabilitatea p(x/wI Bazat pe aceste cunostinte se poate calcula probabilitatea a posteriori p(wj /x) pentru o forma necunoscuta. Probabilitatea a posteriori p(wj /x) a unei forme necunoscute ne spune ca daca o masuratoare facuta asupra formei necunoscute are valoarea x forma apartine clasei wj cu probabilitatea p(wj /x). Calculul probabilitati conditionate p(wj /x) se face pe baza formulei lui Bayes:

(2.23)

unde:

,

m reprezinta numarul de clase.

Forma necunoscuta trebuie asignata clasei cu p(wj /x) maxim. Formula poate fi generalizata pentru cazul unor vectori de trasaturi n dimensionali.

(2.24)

unde:

X este vectorul de forma n-dimensional.

Clasificarea Bayes este de forma:

Di(X) = P(wi)*p(X/wi i =1,.,n (2.25)

Recunoasterea necontrolata. Tehnici de grupare

Tehnicile de grupare consta dintr-un set de algoritmi care asigura impartirea spatiului formelor in clase, grupe de forme, fara a face apel la existenta prealabila a unui set de predictie cunoscut. Conceptul de grupare poate fi inteles cel mai bine prin prezentarea celui mai simplu algoritm de grupare (denumit algoritm de tip prag). Algoritmul presupune existenta in spatiul formelor a unui set de forme si stabilirea initiala a unei distante minime (numita distanta de prag) dintre doua forme. Daca distanta dintre doua forme este mai mica decat distanta de prag, cele doua forme fac parte din aceeasi clasa. Notam cu T distanta prag. Initial se stabileste aleatoriu un prim centru de grup pe care-l notam cu Z1(Z1 corespunde cu una din cele N forme). Se calculeaza distanta dintre acest centru si toate celelalte forme. Daca distantele calculate sunt mai mici decat T, formele respective sunt atribuite clasei w , a carei centru este Z1. Prima forma situata la o distanta mai mare decat T conduce la crearea unei noi grupari (clase) wi cu centrul definit de forma respectiva. Se reia calculul distantelor pentru formele ramase, luand in considerare noua grupare creata.

Procesul de obtinere de noi grupari si de atribuire a formelor la aceste grupari continua pana in momentul in care sunt clasificate toate formele. Algoritmul este prezentat in figura Fig. 2.3-1.

Fig. 2.3‑ Algoritm de tip prag.

Studiind acest algoritm pot fi determinate o serie de caracteristici ale tehnicilor de grupare.

Alegerea centrelor claselor (gruparilor)

Modul de alegere afecteaza viteza de clasificare ca si numarul de grupe (clase) care rezulta in urma executarii procedurii de clasificare. Din acest motiv se recurge, de obicei, la calculul continuu a unui centru al clasei pe masura ce la acesta se atribuie noi forme. In acest caz, centrul gruparii poate sa nu corespunda cu o forma existenta.

Alegerea criteriului de clasificare.

In cazul exemplului dat, criteriul de clasificare este o distanta. Se observa ca valoarea lui T afecteaza rezolutia procesului de clasificare. Daca T este prea mare, doua sau mai multe clase distincte pot fi grupate in una singura. In cazul in care T este prea mic, o grupare poate fi impartita in mod artificial in cateva grupe. Pentru determinarea valori lui T se tine cont de efectul pe care-l va avea aceasta valoare asupra numarului de grupari. In cazul general se utilizeaza criteriile de similaritate si nesimilaritate prin care se asigura apartenenta unei forme la o clasa. Acestea pot fi distante sau alti parametri.

In figura Fig 2.3-2 se prezinta un algoritm general de grupare care ia in considerare criteriile de grupare specificate anterior.

Fig. 2.3‑ Algoritm de grupare

Tehnici de invatare

Aceste tehnici dezvolta algoritmi prin care sunt construiti coeficientii functiei de decizie utilizand o metoda tip 'feed-back'. Algoritmii opereaza asupra unui set de forme a caror apartenenta la clasa este cunoscuta. Determina coeficientii functiei de decizie conform unuia din cele trei criterii de clasificare (specificate anterior), interativ, pana la satisfacerea conditiilor impuse.

Pentru a ilustra cele mentionate presupunem un set de N forme impartit in doua clase w si w . Ne propunem sa determinam coeficientii vectorului pondere W. Functia de decizie data de relatia (1.9), pentru un spatiu n-dimensional, are forma

D(X)=[W1, .,Wn,Wn+1]X, unde X=[x1I,x2I] pentru i=1,.,n.

Pentru formele x1i aprtine w , functia de decizie este pozitiva si negativa daca x2I apartine w (vezi paragraful 1.2.2.a). Prin urmare criteriul care se urmareste a fi atins este D(X)>0. Algoritmul alege o forma si calculeaza functia sa de decizie. Daca D(X)>0, vectorul pondere este satisfacator si nu se modifica. Se trece la urmatoarea forma. Daca D(X)<0, vectorul de ponderi trebuie sa fie modificat astfel incat functia de decizie sa devina pozitiva. Daca aceasta conditie a fost indeplinita pentru toate formele din clasa w se repeta operatia pentru formele din clasa w (care au fost inmultite in prealabil cu -1 pentru ca functia de decizie sa fie pozitiva). Operatia presupune:

i)            stabilirea unei valori initiale pentru vectorul de ponderi;

ii)          stabilirea unei modalitati de modificare a lui W.



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1525
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved