Üdvözöljük
az e-magyar.hu Digitális Nyelvfeldolgozó Rendszer honlapján!



Az e-magyar.hu rendszer a magyar nyelv gépi elemzésének alapvető eszközeit tartalmazza egy integrált, szabványos keretben. Olyan eszközöket adunk közre, amelyek külön-külön és rendszerbe szervezve is hasznosak a magyar nyelvű szöveggel, beszéddel foglalkozó kutatók, intelligens alkalmazást fejlesztők és a nagyközönség számára is. Ezek az eszközök nélkülözhetetlen infrastruktúrát nyújtanak a magyar nyelv digitális elemzésére, a magyar digitális nyelvhasználat támogatására.

A magyar nyelv számítógépes elemzése nem (csupán) a nyelvészek érdeklődését szolgálja. A digitális kommunikáció korában manapság laptopok, tabletek és főleg okostelefonok segítségével érintkezünk egymással, és kommunikálunk egyre inkább gépi rendszerekkel. Mindez azonban továbbra is emberi nyelven történik, ami feltételezi azt, hogy ezeknek az eszközöknek és gépi rendszereknek nyelvileg is okosodniuk kell ahhoz, hogy hasznos segítőink legyenek. A távlati cél az, hogy a gépi rendszerek, alkalmazások értsenek a nyelvünkön. Bár ettől még távol vagyunk, de az itt közreadott eszközök az első lépést jelentik ebben az irányban. Nélkülük nem születhetnek magyar nyelvű intelligens alkalmazások, és tágabb értelemben nélkülük nem lehetséges felzárkóztatni a magyar nyelvet a digitális térben a nagy támogatottsággal rendelkező nyelvekhez.

Fontos cél volt, hogy az elemző eszközöket nyílt forráskóddal szabadon elérhetővé tegyük a kutatás-fejlesztés és az ipari felhasználás számára. A szakmai felhasználók, fejlesztők mellett a technológiai kérdésekben járatlan kutatók illetve a nagyközönség igényeit két módon is igyekszünk kiszolgálni. Egyrészt a honlapon üzemeltetünk egy webszolgáltatást, amely az oldalra bemásolt szövegeket elemzett alakban adja vissza. Az összetettebb elemzést igénylők az e-magyar.hu eszközöket beépülő modulként használhatják a nemzetközileg is ismert GATE nyelvelemző rendszerben. (Erről a lehetőségről további részletek itt találhatók).


Az e-magyar.hu rendszer a Magyar Tudományos Akadémia támogatásával készült a 2015-ben kiírt infrastruktúrafejlesztési pályázat keretében. A munkálatok a pályázat kedvezményezettje, a Nyelvtudományi Intézet koordinálásával széleskörű együttműködés keretében folytak, melyben részt vett a hazai nyelvtechnológia számos vezető kutatás-fejlesztő műhelye. A kifejlesztett új infrastruktúra továbbfejlesztette, szabványosította és integrálta a különböző műhelyekben készült eszközöket.

Az infrastruktúra két részből áll. Az egyik rész az írott szöveg elemzésével foglalkozik (részletesebben lásd itt), a másik rész a beszédfeldolgozást segíti egy beszédadatbázissal és beszédelemző modulokkal (további információ itt). A munkálatokat Váradi Tamás koordinálta, a szövegfeldolgozó részt Oravecz Csaba, a beszédfeldolgozási munkát Kornai András irányította.