 |

 |
Dicționar electronic unificat – DEU sâmbătă, 15 ianuarie 2005
Iaşi,
IASSID iniţiază proiectul Dicţionarul electronic unificat. Acesta se doreşte a fi un instrument electronic, care, pe de o parte permite un control al evoluţiei limbii române din punct de vedere terminologic, iar pe de altă parte constituie resursa lingvistică pe baza căreia se dezvoltă aplicaţii software.
Financiarul: „Prima platformă multilingvă românească - eCOGITO“miercuri, 1 decembrie 2004
Iaşi,
eCOGITO este o iniţiativă inovatoare care reuneşte eforturile IASSID în cercetarea interdisciplinară (software, lingvistică, matematică, sociologie, cibernetică), înalta expertiză şi competenţă a Academiei Române şi experienţa Agenţiei Naţionale pentru Stiinţă, Tehnologie şi Inovare.
Lansare eCOGITO — Soluție de traducere luni, 1 noiembrie 2004
Iaşi,
IASSID lansează eCOGITO Soluţie de traducere pentru administraţia publică.
eCOGITO — Soluţie de traducere este o platformă software destinată traducerii automate, cu personalizarea resurselor lingvistice (vocabulare, dicţionare, reguli) pe domeniul de activitate al clientului.
Lansare Procesor Lingvistic 2004miercuri, 20 octombrie 2004
Iaşi,
Procesorul Lingvistic pentru Limba Română este unul din primele instrumente din lume care face posibil accesul la informaţie de orice natură (juridică, ştiinţifică, culturală) prin controlul limbii române la nivel gramatical şi semantic.
Premii IT&C 2004sâmbătă, 7 februarie 2004
Bucureşti,
IASSID participă la Premiile IT&C ale României pentru anul 2004 cu proiectul eCOGITO.
Bruxelles — EUREKA 2001 vineri, 16 noiembrie 2001
Bruxelles,
IASSID a obţinut la Salonul Internaţional al Inveţiilor, EUREKA, Bruxelles premii şi medalii care au evideţiat eforturile proprii de cercetare aplicativă şi dezvoltare experimentală.
București — BINARY 2001luni, 8 octombrie 2001
Bucureşti,
IASSID a obţinut premiul pentru cel mai bun produs ştiinţific la BINARY 2001.
|
 |
 |
 |
|
 |
INSTRUMENTE SUPORT PENTRU TRADUCERE AUTOMATĂ
EXTRACTOR DE TERMENI
Este un program complex, dotat cu funcţii de procesare semantică, putând executa operaţii de căutare, extragere şi înlocuire de termeni. Acest lucru face posibilă extragerea automată de terminologie pe baza Dicţionarelor şi Glosarelor proprii strict specializate sau dintr-un document ori dintr-o listă de cuvinte dată.
În cadrul procesului de îmbunătăţire a traducerii se utilizează un instrument automat de căutare şi înlocuire care operează la nivel de termeni şi expresii. Elementele care se repetă sunt stocate într-o bază de date, în memoria de traducere TWB. Acest instrument înlocuieşte şiruri predefinite (de la cuvinte până la nivel de paragrafe) în documentul sursă, creând un document sursă iniţial care este o combinaţie între cuvintele limbii sursă şi ale limbii ţintă. Cele mai bune rezultate se obţin atunci când un document conţine un număr mare de elemente care se repetă.
EDITORUL DE ALINIERE
Alinierea este o operaţie care constă în divizarea a două texte în limbi diferite (limba-sursă şi limba-ţintă) în propoziţii şi apoi plasarea acestora în paralel. Rezultatul acestei operaţiuni este un singur fişier conţinând diferite perechi de propoziţii, care, după verificare şi corectare, este stocat în memoria de traducere TWB. Utilizatorul trebuie să definească valorile pentru un set dat de atribute, permiţând astfel etichetarea individuală a segmentelor în memoria de traducere.
O aliniere se poate face pentru:
MULTITERM
MultiTerm reprezintă software-ul de terminologie folosit la nivel de secţiune: noi intrări sunt adăugate în baze de date locale MultiTerm, încorporate apoi în Dicţionarele Automate proprii, după validare.
ONE-STOP SHOP
One-Stop Shop este o interfaţă cu o singură căutare, permiţând utilizatorilor să consulte mai multe baze de date simultan (de exemplu: glosare, dicţionare, memoria centrală TWB). Această interfaţă este dezvoltată în vederea centralizării, simplificării şi accelerării căutării de terminologie.
TRANSLATOR’S WORKBENCH
Translator’s Workbench (TWB) este un instrument integrat de asistare a traducerii, având urmatoarele trăsături: capacitate multilingvă, integrare cu sistemul de procesare la nivel de cuvânt şi performanţă. Translator’s Workbench are posibilităţi reale de sharing, astfel încât traducătorii pot evita cu succes traducerea de două ori a aceluiaşi document. În plus, având toate datele la dispoziţie, traducătorii se pot concentra asupra găsirii cuvântului potrivit într-o manieră eficientă, fără a fi nevoiţi să presteze activităţi repetitive.
Ideea de bază este asigurarea unui sharing real al datelor, care se autodezvoltă prin activitatea curentă, prin păstrarea într-o memorie centrală de traducere a diferitelor tipuri de unităţi de traducere, de la simpli termeni până la fragmente de text. Această memorie nu se utilizează direct în timpul procesului de traducere, ci este doar o bază de date accesată pentru a căuta sau stoca date procesate prin Translator’s Workbench sau/şi MS Word.
TWB permite accesul traducătorului la toate resursele lingvistice, terminologice şi frazeologice dintr-o memorie locală de traducere. Fragmente similare sau identice din texte deja traduse sunt oferite ca sugestii. Fragmentele din memoria de traducere au o etichetare individuală, anume un set de atribute (traducător, numărul documentului, domeniul, tipul de document).
TWB este deosebit de util, deoarece un mare număr de acte legislative se bazează pe texte precedente sau pe legislaţia în vigoare.
eCOGITO PLATFORMĂ PENTRU MANAGEMENTUL INFORMAŢIEI MULTILINGVE
eCOGITO este o iniţiativă inovatoare care reuneşte eforturile IASSID de cercetare interdisciplinară (software, lingvistică, matematică, sociologie, cibernetică), expertiza şi competenţa Academiei Române, experienţa Agenţiei Naţionale pentru Ştiinţă, Tehnologie şi Inovare.
România va deveni participant la circulaţia informaţiilor în mediile electronice, aplicaţia software oferind acces la informaţii multilingve aflate în formate electronice şi locaţii diverse, furnizând totodată o bază de decizie superioară administraţiei publice, companiilor, dar şi oricărei persoane.
Componentele sale - browser/searcher integrat pentru Internet/Intranet, procesor de format electronic, translator multilingv, text & data miner şi VRS - vor oferi utilizatorilor informare, consultare, consultanţă, dar şi un spaţiu de laborator (simulare) pe probleme specifice.
Proiectul este posibil ca urmare a succesului ştiinţific înregistrat în dezvoltarea Procesorului Lingvistic pentru Limba Română, instrument software complex destinat analizei lingvistice (fonetică, morfologică, sintactică, structurală, stilistică, semantică), dotat pentru fiecare tip de procesare cu funcţii statistice specifice. Acest instrument face ca limba română să fie una din puţinele limbi din lume asistate la nivel electronic, anulându-se astfel barierele lingvistice şi deschizându-se accesul către exportul şi importul informaţiilor în şi din alte culturi.
Având ca instrument de bază Procesorul Lingvistic, eCOGITO va sumariza, clasifica şi indexa documente electronice, va realiza traduceri automate, rapide, cu păstrarea stilului, va recunoaşte vorbirea şi va citi texte multilingve, va recunoaşte textul scris şi va simula un subiect uman care poate intra în conversaţie cu subiecţi umani reali pe un univers de discurs în diferite limbi.
Astfel, eCOGITO este o platformă lingvistică dar şi un instrument de integrare a informaţiei în scopul construirii unei imagini clare şi totodată complexe asupra unui domeniu.
TRADUCĂTOR AUTOMAT
Aplicaţie software destinată traducerii automate rapide, cu păstrarea stilului, a unui text din limba română în limba engleză sau din limba engleză în limba română. Traducerea se realizează printr-un proces de analiză gramaticală (morfologică, structurală, sintactică) şi semantică a documentului şi apoi prin generarea acestuia în limba ţintă.
Caracteristici:
-
Dispune de dicţionare de cuvinte, expresii şi locuţiuni cu peste 1 milion de intrări;
-
Permite crearea de dicţionare personalizate;
-
Permite vizualizarea şi modificarea procesului de traducere la nivel morfologic, sintactic, semantic, echivalenţă de termeni;
-
Conţine dicţionare specifice domeniilor: legislativ, medical, economic, tehnic;
-
Păstrează structura originală a documentului.
CĂUTĂTOR SEMANTIC
Este un instrument software destinat căutării, transferului informaţiilor în baza de date proprie indiferent de locaţia lor fizică (sistem local, reţea LAN, WAN, sau Internet) şi totodată transmiterii acestora. Căutarea şi selecţia se realizează prin identificarea ştirilor pe baza pattern-ului (profil de ştire) definit de utilizator.
PROCESOR DE FORMAT
Este o suită de unelte - recunoaştere şi sinteză vocală, OCR, modul de interfaţare cu baze de date - care realizează conversii între diferite formate electronice, în scopul exploatării informaţiei, independent de formatul în care se află (text, audio, imagine, baze de date).
TEXT & DATA MINER
Este o aplicaţie software pentru sumarizarea, indexarea, clasificarea şi regăsirea informaţiilor de tip document şi baze de date.
Caracteristici:
-
Sumarizarea documentelor la nivel semantic;
-
Extragerea informaţiilor din documente: cuvinte cheie, domeniu, date, autori, sursa documentului, limbă, subiect, teme;
-
Utilizarea procesorului lingvistic;
-
Indexarea informaţiilor obţinute, clasificarea şi organizarea lor pe baza informaţiilor extrase din documente (tip: contract, documentaţie, publicaţii, domeniu, subiect, temă, autori);
-
Căutarea flexibilă a documentelor de tip text prin cuvinte cheie şi operaţii booleene, pe baza informaţiilor obţinute în faza de indexare şi clasificare, prin descrierea documentelor sau mixt;
-
Căutarea de informaţii în baze de date relaţionale în funcţie de pattern-uri, cuvinte cheie sau limbaj natural;
-
Analiza şi sinteza informaţiilor de tip text sau baze de date.
VRS — VIRTUAL RATIONAL SYSTEM
Este un mediu de dezvoltare pentru tehnologia şi dezvoltarea cunoştinţelor, care gestionează dinamica unei baze de cunoştinţe şi accesul la aceasta prin simularea comportamentului conversaţional uman şi a modului de raţionare. VRS este un produs software care simulează un subiect uman cunoscător sau nu al unui domeniu (care este dat de baza de cunoştinţe pe care o deţine) şi care poate intra în conversaţie cu subiecţi umani reali pe un univers de discurs într-o limbă europeană aleasă.
|
 |