Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
AstronomieBiofizicaBiologieBotanicaCartiChimieCopii
Educatie civicaFabule ghicitoriFizicaGramaticaJocLiteratura romanaLogica
MatematicaPoeziiPsihologie psihiatrieSociologie


NIVELURI ALE PROCESARII LIMBAJULUI NATURAL

Psihologie psihiatrie



+ Font mai mare | - Font mai mic



NIVELURI ALE PROCESARII LIMBAJULUI NATURAL

Structura oricarei limbi naturale (umane) se imparte in cinci niveluri diferite: fonologie, morfologie, sintaxa, semantica si pragmatica. Aceste niveluri coincid cu formele de cunostinte relevante si, in acelasi timp, necesare pentru intelegerea limbajului natural. Dintre toate acestea, lucrarea de fata se concentreaza asupra nivelului sintactic si a celui semantic, precum si a legaturii existente intre acestea. Inainte de a trece la studiul sintaxei si al semanticii computationale, ne propunem o scurta incursiune la toate nivelurile analizei limbajului.



Fonologia se ocupa cu studiul fonemelor (ca entitati abstracte, care se realizeaza printr-o infinitate de sunete). Cunostintele fonetice si fonologice sunt cruciale pentru sistemele bazate pe vorbire (in procesarea vorbirii).

Morfologia, in gramatica traditionala, este o stiinta a cuvantului urmarit sub aspect gramatical, adica sub aspectul variatiei formei sale (al flexiunii) pentru exprimarea diverselor categorii gramaticale, prin opozitie cu sintaxa, care studiaza combinarea cuvintelor si functiile pe care acestea le iau in cadrul combinatiilor. Odata cu aparitia structuralismului, interesul cercetatorilor s-a deplasat de la cuvant la morfem, ca unitate minimala de expresie purtatoare de semnificatie lexicala sau gramaticala . Efectul acestei deplasari il constituie estomparea granitei prea rigide dintre morfologie si sintaxa, caci ambele discipline studiaza combinatii de morfeme si comporta tipuri asemanatoare de relatii, avand ca efect aparitia morfosintaxei. In masura in care unii structuralisti (L. Bloomfield, J. Vendryes) pastreaza autonomia celor doua discipline, morfologia studiaza regulile care guverneaza structura interna a cuvintelor atat in cadrul flexiunii, cat si al formarii cuvintelor, incluzand o morfologie flexionara si una derivationala.

Granita dintre flexiune (care furnizeaza diferitele forme ale unui cuvant) si derivare (care produce cuvinte noi pornind de la cele existente) este uneori neclara. O diferenta esentiala o constituie aceea ca numai derivarea poate introduce o schimbare de sens (prin introducerea de cuvinte noi). O alta deosebire consta in faptul ca formele derivative ar putea sa nu existe, in timp ce formele flexionare nu lipsesc aproape niciodata.

In limba engleza, pentru care s-au dezvoltat aproape toate teoriile computationale, flexiunea este mult mai simpla decat derivarea (prin contrast, de pilda, cu limba latina, dar si cu unele limbi ca rusa, japoneza sau finlandeza). Simplitatea flexiunii in limba engleza face ca majoritatea cercetatorilor din domeniul lingvisticii computationale sa neglijeze morfologia. Pentru procesarea eficienta a altor limbi naturale, inclusiv a limbii romane, este insa necesara dezvoltarea unor modele computationale adecvate ale morfologiei fiecarei limbi. In cazul limbii romane, un model al morfologiei ei flexionare este creat si implementat la Centrul de Studii Avansate al Academiei Romane sub coordonarea lui D. Tufis.

Indiferent daca avem de-a face cu morfologia flexionara sau cu cea derivationala, putem spune ca, din punct de vedere computational, nivelul morfologic al limbii se ocupa de modul in care sunt alcatuite cuvintele pornindu-se de la unitatile de baza numite morfeme.

Sintaxa reprezinta, intr-o conceptie asupra organizarii stratificate, pe niveluri, a limbii, acel nivel a carui organizare se desfasoara intre cuvant, ca unitate minimala si combinatiile acestuia: propozitii/fraze, ca unitati maximale. Cunostintele sintactice se refera la modul in care pot fi alaturate cuvintele pentru a forma propozitii corecte si determina care este rolul structural al fiecarui cuvant in cadrul propozitiei, precum si ce grupuri sintactice intra in componenta altor grupuri sintactice. Prin urmare, nivelul sintactic determina rolul structural al fiecarui cuvant in interiorul unei propozitii, precum si relatiile dintre propozitii in cadrul frazei.

Sintaxa (constructia propozitiilor) reprezinta nivelul cel mai de jos la care limbajul natural (uman) este, in mod constant, creator. Vorbitorii unei limbi creeaza mult mai rar unitati fonice si lexicale. In schimb, sunt concepute in mod constant noi propozitii si fraze. Acest tip de creativitate deosebeste sintaxa atat de fonologie, cat si de morfologie. (In timp ce putem alcatui o lista cu fonemele unei limbi, cu unitatile ei lexicale si cu regulile morfologice, nu exista nici o modalitate de a intocmi o lista similara a structurilor de propozitie admisibile intr-o limba data. Atata timp cat nu este impusa o limita asupra lungimii propozitiilor, se poate demonstra ca numarul structurilor de propozitie admisibile este infinit.)

Noam Chomsky (1957) este primul care evidentiaza aceasta idee. El introduce gramatica generativa, care descrie propozitiile furnizand reguli de constructie a lor. Astfel de reguli vor deveni standard nu numai in lingvistica, ci si in informatica, cu precadere in proiectarea compilatoarelor. Ceea ce este interesant si, in egala masura, crucial, in cadrul acestei teorii, este faptul ca o multime finita de reguli poate descrie un numar infinit de propozitii.

Procesul de recunoastere a structurii unei propozitii de catre un calculator se numeste parsing. Aceasta este analiza sintactica computationala. In esenta, vom spune ca, pentru a analiza sintactic o propozitie, un calculator trebuie sa o imperecheze pe aceasta cu regulile care o genereaza. Acest proces de imperechere poate fi realizat in maniera top-down (de sus in jos) sau bottom-up (de jos in sus) precum si prin unele combinatii ale lor care si-au dovedit eficienta.

Analiza sintactica de acest tip a propozitiilor englezesti a fost studiata pe larg si este practic considerata o problema incheiata. Astazi se poarta discutii exclusiv asupra modului cel mai eficient in care se poate realiza procesul de parsing in cazul limbii engleze si nu referitor la faptul ca acest lucru este sau nu posibil. Analiza sintactica computationala referitoare la alte limbi nu a fost investigata la fel de riguros si ea ramane, in multe cazuri, o problema deschisa. Cu atat mai mult cu cat majoritatea tehnicilor de parsing existente se bazeaza pe ordinea fixata a cuvintelor si nu lucreaza la fel de eficient pentru limbile in care ordinea cuvintelor este extrem de variabila, cum ar fi latina, rusa sau finlandeza.

Semantica este o ramura a lingvisticii, dar si a altor stiinte (filozofie, logica, psihologie) al carei obiect de studiu este sensul , unitate greu de abordat dintr-o perspectiva unica si unitara. Ca disciplina lingvistica, semantica este ultima creata (in sec. al XIX-lea). In functie de diversele aspecte ale sensului luate in consideratie, se delimiteaza semantica lingvistica si semantica apartinand altor stiinte, chiar daca interferentele dintre diferitele tipuri de semantica sunt curente.

Retinem, inca de la inceput, faptul ca nivelul semantic se refera la sensul cuvintelor si al propozitiilor, precum si la modul de combinare a semnificatiilor cuvintelor pentru a forma semnificatia unei intregi propozitii. La acest nivel, semantica computationala face un studiu al sensului independent de context. Cu alte cuvinte, intereseaza sensul pe care o propozitie il are fara legatura cu contextul in care ea a fost utilizata.

Pragmatica se ocupa de utilizarea limbii in context. Astfel, pragmatica este o disciplina al carei obiect il constituie limba, privita nu ca sistem de semne, ci ca actiune si interactiune comunicativa. Pragmatica examineaza, cu precadere, efectele diverselor componente ale contextului asupra producerii si receptarii enunturilor, atat sub aspectul structurii, cat si al semnificatiei acestora. In procesarea limbajului natural nivelul pragmatic trateaza folosirea propozitiilor in diverse situatii (contexte), precum si modul in care contextul influenteaza interpretarea unei propozitii.

Pragmatica a aparut ca o reactie atat fata de lingvistica chomskyana, cat si fata de pozitivismul logic, iar domeniul ei de investigatie a cunoscut ulterior o continua extindere si diversificare.

Intre semantica si pragmatica exista o relatie de complementaritate, ultima atribuind un rol esential contextului. Pragmatica are o problematica proprie , care include aspecte referitoare la: organizarea pragmatica a discursului (acte de vorbire, forme ale implicitului conversational - presupozitii, implicaturi etc.), principiile si strategiile comunicative, analiza conversatiei. Un asemenea tip de analiza este ingreunat de diversi factori, cum ar fi relatia de referinta, extrem de frecventa in fragmentele de discurs apartinand limbajului natural. Astfel, se stie ca, intr-o limba data, un enunt comporta o referinta la o anumita stare de lucruri sau la o anumita persoana. Relatia de referinta, ca relatie particulara dintre limba si lume, nu se poate realiza decat prin context. Contextul localizeaza in timp si spatiu, cuantifica, determina gradul de generalitate al unui cuvant.

Referinta poate interveni in cadrul aceleiasi propozitii (Ion a afirmat ca el nu crede asta) sau cu privire la propozitii diferite, in virtutea diverselor proceduri de anaforizare existente. In propozitia

Ion crede ca a gasit palaria lui.

pronumele lui ar putea sa se refere la Ion (care intervine in aceeasi propozitie) sau la un alt posesor al palariei, o cu totul alta persoana, care a fost mentionata intr-o propozitie anterioara. Numai contextul poate ajuta in dezambiguizare.

Foarte delicata este elucidarea referintelor si a coreferintelor realizate prin intermediul pronumelor. Tocmai de aceea, la nivelul discursului, care se ocupa de modul in care propozitiile imediat premergatoare afecteaza interpretarea propozitiei urmatoare, un aspect important se refera la interpretarea pronumelor si la aspectul temporal al informatiei vehiculate.

O alta forma de cunoastere relevanta pentru intelegerea si prelucrarea limbajului natural o constituie cunoasterea universului, prin care intelegem cantitatea vasta de cunostinte necesare in vederea intelegerii textelor. Acestea includ cunostintele generale despre structura lumii inconjuratoare la care face referire vorbitorul pentru ca, spre exemplu, sa poata face fata conversatiei, precum si informatiile pe care trebuie sa le aiba un vorbitor despre partenerii sai de discutie.

Actualmente, in domeniul procesarii limbajului natural, exista trei mari directii reprezentate de sintaxa computationala, semantica computationala si generarea limbajului (care studiaza modul in care masina genereaza text coerent).

Controlul creierului uman cu ajutorul sunetelor si al computerelor

"Un sistem de comunicatii in care purtatori imperceptibili (de catre urechea umana) , in frecvente audio foarte joase sau foarte inalte sau in spectru frecventelor adiacente ultrasonice sau frecvente modulate cu intentie si propagati acustic sau prin vibratii, in scopul inducerii in creierul uman (ale unor emotii), in mod tipic prin intermediul boxelor sau castilor audio. Purtatorii modulati pot fi transmisi in timp real sau pot fi inregistrati si stocati mecanic, magnetic sau pe medii optice de inregistrare pentru transmisii programate sau transmisii multiple."

Potrivit documentatiilor firmei Silent Sounds Incorporated ( "Sunete tacute Inc.") este posibil, cu ajutorul unor computere puternice, sa analizam electroencefalograma emotiilor umane, sa definim o structura emotionala si sa o reproducem, sa putem stoca aceste structuri emotionale umane pe un computer si apoi sa le inducem unei alte persoane fara ca aceasta sa fie constienta de acest lucru. Ilustratiile grafice care insotesc aceasta documentatie ("Induced Alpha to Theta Biofeedback Cluster Movement"), catalogate sub numarul #AB 116-394-95, publice, sunt realizate cu cele mai sofisticate electroencefalografe existente, cu o putere de detectie de 5 ori mai mare decat a unui aparat uzual. Programele de calculator folosite includ tehnologia de curatare si redefinire a semnalelor auditive (Noisenulling tehnology) folosite pina in prezent doar pe submarinele militare atomice in scopul detectiei sub apa a unor obiecte mici la distante foarte mari. Toata aceasta tehnologie de ultima ora este folosita pentru detectia acestor structuri emotionale de care aminteam mai sus prin analiza semnalelor periodice emise de creierul uman. In realitate se realizeaza doua encefalograme ale emisferelor creierului care desi par diferite sunt in fapt identice. Exista deci tehnologia care poate sa schimbe emotiile unei fiinte umane prin sunete imperceptibile. Firma mai sus mentionata a facut o afirmati initiala potrivit careia nu este interesata decat de aplicatii benefice pentru umanitate. Departamentul de Aparare al SUA a fost insa de alta parere si este evidenta importanta acestei tehnologii pentru tehnica militara. Edward Tilton, presedintele firmei Silent Sounds Inc., scria intr-o scrisoare datata 13 decembrie 1996: " Toate schemele si formulele au fost catalogate drept secrete de catre guvernul american si nu suntem autorizati sa dezvaluim detalii exacte. facem casete si CD-uri pentru guvernul german, chiar si pentru state din fosta URSS! Totul cu permisiunea Departamentului de Stat al SUA bineinteles. Sistemele au fost utilizate in Operatiunea Furtuna in Desert ( Irak) cu success."



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1350
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved