„Labdaba rughatunk?"

Nemcsak a legújabb technikai vívmányok használatában, de a kutatásokban és végső soron a gazdasági fejlődésben is lemaradnak azok az országok, amelyek lakosai nem tudnak angol nyelven kommunikálni. Vajon a magyar nyelv felveheti-e a versenyt a legelterjedtebb közvetítő nyelvvel, van-e esélye egyáltalán a fennmaradásra a digitális korban?

Mi a magyar nyelv esélye a digitális túlélésre? Milyen technológiai támogatás szükséges a nyelvi akadálymentesítésre? Hol tart a hazai nyelvtechnológia a nemzetközi mezőnyben? - többek között ezekre a kérdésekre keresték a választ a magyar nyelv napja alkalmából a közelmúltban rendezett kerekasztal-beszélgetésen nyelvészek, matematikusok, mérnökök és nyelvtechnológusok az MTA Nyelvtudományi Intézetében.

Mire jó a nyelvtechnológia?
- Európában máig egyetlen komoly határvonal maradt fenn a nemzetek között: a nyelvi határvonal - hívta fel a figyelmet az MTA Nyelvtechnológiai Kutatócsoportjának vezetője. Váradi Tamás elmondta, a nyelvtechnológia egyik fő feladata a nyelvi korlátok lebontásának támogatása.
- A karakterfelismerő, sms-írást segítő, nyelvoktató, navigációs és beszéddel vezérelt beágyazott rendszerek, az online játékok, a szövegfelolvasók, a gépi fordítók, a diktálók és az internetes keresőrendszerek mind a nyelvtechnológiai fejlesztések közé tartoznak - ismertette előadásában Váradi Tamás. A Nyelvtudományi Intézet tudományos főmunkatársa elmondta, az élvonalbeli rendszerek használata a nyelvek szűk körére korlátozódik, ezért szükséges megvizsgálni, mi módon lehetne a technológiai újítások széles körét magyar nyelven is használhatóvá tenni. A nyelvtechnológiának kulcsszerepe van ugyanis a nemzeti nyelvek korszerűvé tételében, és abban, hogy beillessze azokat a digitális társadalomba.

Nyelvhalál?
- Nyelvhalálhoz vezethet, ha bizonyos funkciókat, amelyeket a nyelv betölt, más nyelvek vesznek át olyan területeken, mint például a kereskedelem vagy az oktatás. Kihalófélben lévő nyelvek esetében gyakran látjuk azt is, hogy elveszítik a presztízsüket, vagyis ciki azon a nyelven beszélni. Figyelmeztető jelenség a nyelvi kompetencia elvesztése is, vagyis, amikor egyre egyszerűsítettebb nyelvtannal, szókinccsel, morfológiával beszélnek a fiatalabb nyelvhasználók. A digitális korszakban már a digitális funkciók elvesztése is fenyegetheti a nyelveket. Vajon magyar nyelven fel lehet-e nevelni digitális bennszülötteket? - tette fel a megoldásra váró kérdést Kornai András matematikus, nyelvész.

Életképes nyelv a magyar
A Számítástechnikai és Automatizálási Kutatóintézet (Sztaki) munkatársa elmondta, vannak biztos digitális jövőjű nyelvek, amelyeket az emberiség mindenhová magával vinne, még az űrbe is. Az egész világon beszélt több mint hatezer nyelv közül 99 tartozik a biztos jövőjű nyelvek közé. A magyar nyelv nem sorolható ezek közé. Noha a Microsoft szoftvergyártó cég ad ki magyar nyelvű szövegszerkesztő programot, de csak az egyik operációs rendszerre.
- Azok a nyelvek, amelyek beszélőközösségei nem állítanak össze a többnyelvű, online szabad enciklopédiába szócikkeket, olyanok, mintha nem is léteznének - fogalmazott Kornai András. A kutató hozzátette, ma már több száz Wikipédia létezik, és további 133 van korai, úgynevezett inkubátorfázisban. Ezeknek a tudásbázisoknak a nyelve életképes. Ide sorolható a magyar nyelv is, amely a nem digitális skálán a Kornai András felvázolta szempontok szerint a világon a huszadik legnagyobb nyelv.

Digitális funkcióvesztés fenyeget
A szakember szerint előfordulhat, hogy azokra a funkcionális területekre nem kerül be a magyar, amelyekre más nyelvek igen. Anyanyelvünk hátrányos helyzetének számos oka van, többek között az, hogy beszélőközössége jóval kisebb, mint például az angolé; sem ehhez, sem pedig a spanyolhoz, a kínaihoz vagy a némethez nem hasonlító úgynevezett agglutináló nyelv; és a digitális korban olyan jellemzői is nehézséget okozhatnak, mint az, hogy ékezetes betűket használ. A magyar nyelv lemaradása a digitális szférában technológiai és ezzel együtt gazdasági lemaradáshoz vezethet.
- Ma rengeteg dologban az angol a kényszerközvetítő nyelv. Különösen a modern technológiában teli vagyunk olyan nagy teljesítményű szoftvercsomaggal, amelyeket az iparban a mérnökök, a tudósok használnak, és amelyeknek nincs magyar változata. Aki nem tud angolul, az el van veszve, egyszerűen nem képes a korszerű technológiai folyamatba bekapcsolódni - tette hozzá a kutató utalva a mobil beszédtechnológiára, az okostelefonokra és alkalmazásaikra, mint amilyen például az iPhone SIRI nevű beszédfelismerő személyiasszisztens-alkalmazása vagy a mozgássérülteket segítő beszédtechnológia.
- Mindezek angolul jól használhatók, magyarul messze nem annyira. Ez az egyre gazdagodó technológiai világ magyarul nem létezik, és ha nem alkotjuk meg, nem is lesz - jelentette ki Kornai András.

Aki kimarad, lemarad
- Azok az országok, amelyek anyanyelvének nincs digitális léte, vagy csökkentett; noha van írásbeliségük, könyvnyomtatásuk, oktatásuk, le fognak maradni abban az óriási gazdasági, kulturális, tudományos versenyben, amelyben ma már a nyelv digitális funkciójára is szükség van - erősítette meg Kenesei István nyelvész, az MTA Nyelvtudományi Intézetének igazgatója.

A fordító nem tolmács
Hazánkban évtizedek óta folynak nyelvtechnológiai kutatások, a magyar kutatók és fejlesztők nemzetközi szintű eredményeket tudhatnak magukénak. A fejlesztések azonban a felhasználók elől gyakran rejtve maradnak, hiszen az érdeklődők többsége az interneten elérhető, kevésbé minőségi, ingyenes programokat keresi. Előfordul azonban az is, hogy olyan funkciókat is elvárnak a felhasználók, amelyek nem tartoznak az egyes fejlesztések alapfunkciói közé. A gépi fordítóktól például azt, hogy egyfajta tolmácsgépként működjenek. Ez a félreértés pedig további lemaradást generálhat a szakemberek szerint.



- A gépi fordítás nem ugyanaz, mint az idegen nyelvi szótárazás - hívta fel a figyelmet Prószéky Gábor nyelvész, programtervező matematikus. 
A számítógépes nyelvészeti kutatásokat és fejlesztéseket végző MorphoLogic nyelvtechnológiai cég alapítója elmondta, a gépi fordítók a legutóbbi időkig is legfeljebb a megértés támogatására képesek, nem dolguk, hogy a tükörfordításon túl többet nyújtsanak.- A legtöbb felhasználó csak az internetes fordítóprogramokkal találkozik, hiszen azok ingyen vannak. Különböző babasite-okat, sportoldalakat és politikai cikkeket keresgélnek a világhálón, ezek a témák viszont nagyon zavarják egymást, interferálnak, így sok butaság kerül a rendszerbe. Ha lebutítanánk ezeket a fordítókat, okosabbak lennének, azaz ha csak egy nagyon szűk szegmensre alkalmaznánk őket, nagyon jó fordítást adnának - magyarázta Prószéky Gábor. A szakember hozzátette, a kutatást gátolja, hogy nem adhatók el a szakterületekhez köthető gépi fordítók, hiszen az internetes tapasztalatok alapján ezt nem támogatják.

Többszáz milliós korpuszok
Hasonlóan visszaveti a támogatás hiánya az új típusú szótárak készítését. A hagyományos, papír alapú egy- és kétnyelvű szótárak helyett ugyanis nyelvészek és nyelvtechnológusok elő tudnak állítani tartalmában és kivitelezésében korszerű szótárakat; a kiadók azonban üzleti alapon döntenek, és a papíralapú szótárak megjelentetését részesítik előnyben, azok közül is legfőképpen az angol nyelvűeket.
Míg a hagyományos, nyomtatott szótárak struktúrája merev, használat közben nem alakítható az alkalmazás céljaihoz, az új típusú szótárak készítése számítógépes adatbázisok segítségével történik ún. korpusz alapján. A korpuszt mindazok a szövegek alkotják, amelyek az adott nyelv egyes változatain megjelentek. A Magyar Nemzeti Szövegtár jelenleg 187,6 millió szövegszót tartalmaz, amely reprezentatívan tartalmazza a határon innen és túl beszélt mai magyar nyelv jellegzetes megnyilvánulásait. A készülő értelmező és történeti típusú Akadémiai Nagyszótár alapanyagát pedig az a korpusz alkotja, amely a nyelvújítás kezdete, vagyis 1772 és 2000 között keletkezett szépirodalmi, tudományos-ismeretterjesztő, valamint publicisztikai műveket és műrészleteket tartalmazza. Magában foglalja azt a hatmilliós cédulaanyagot is, amelyet a 19. század végétől a hatvanas évek elejéig gyűjtöttek össze, továbbá a nyolcvanas évek közepétől kezdve számítógépre vitt 23 millió szövegszavas adatbázist.

Nem csak az Akadémia feladata
- Az új típusú szótárak létrehozásakor a komoly szürkeállományt végző munkát továbbra is a lexikográfusnak kell végeznie, de a nyersanyag nem a kútfőből, nem a kis cédulás jegyzetekből adódik, hanem abból a világból, ahol egy számítógépes eszköz lényegesen hatékonyabban tud „garázdálkodni". Összeszedi egyrészt a gyakori kifejezéseket éppúgy, mint a különleges új kifejezéseket, másrészt feltünteti, hogy ezek milyen területen használatosak; vagyis előkészíti azt a munkát, amit a hagyományos lexikográfus csak évtizedek alatt tud elvégezni - mondta el érdeklődésünkre Prószéky Gábor. A nyelvtechnológus szerint a korszerű technológiát alkalmazó munkát célszerű lenne nem az Akadémián végezni, hanem egy olyan központban, ahol lehetőség van a lexikográfusok és a technológiai szakemberek közötti állandó visszacsatolásra.
- Ha ez a legfeljebb tíz szakember folyamatosan nyomon követné, milyen új kifejezések fordulnak elő és hol, azonnal továbbíthatnák a lexikográfusoknak, akik feldolgoznák ezeket, így valós időben kerülnének fel a szótárakba a szócikkek, nem pedig évtizedek múlva, amikor egy új szótárt kiadnak. Ráadásul, a lexikográfusnak nem kellene rossz értelemben vett értékítéletet hoznia, hanem statisztikai döntéseket hozhatna: sokkal nagyobb pontossággal vizsgálhatná meg egy-egy szócikk összeállításakor, hogy elég elterjedt-e az adott kifejezés ahhoz, hogy a szótárba bekerüljön. Ez azonban túlmutat a kisvállalkozói szférán - tette hozzá Prószéky Gábor. A MorphoLogic cég vezetője szerint az általuk eddig létrehozott eszközöket - többek között az EU információtechnológiai díjának nyertes szótári rendszerét, a MoBiMaust - állami támogatással érdemes lenne közkinccsé tenni, hogy azok is használhassák azokat, akik eddig nem tudtak róla vagy anyagi forrásaik nem engedték.

A beszélő hangjára emlékeztet

A kerekasztal-beszélgetésen részt vett Bánréti Zoltán, a Nyelvtudományi Intézet tudományos tanácsadója, és Németh Géza villamosmérnök, beszédtechnológus is, aki úgy fogalmazott: a legkorszerűbb technológiai tudásokat a legfelkészültebb kutatócsoportok is lassan tudják felépíteni, anyagi támogatás nélkül azonban gyorsan lerombolódnak az eddigi eredmények is. A stagnálás ugyanis egyenlő a lemaradással.
Németh Géza felvázolta, hogyan képesek magyar kutatók olyan ún. beszédszintetizátort megalkotni, ami nagyon emlékeztet az adott beszélő hangjára. A Budapesti Műszaki Egyetem Beszédtechnológiai laboratóriumának vezetője felhívta a figyelmet arra is, hogy a magyar kutatók hasonló eredményeket tudnának felmutatni, mint a legnagyobb szoftvergyártó cégek szakemberei, csakhogy munkájuk mögött jóval kisebb finanszírozás áll.

Németh Géza és a BME kutatócsoportjának munkájáról a későbbiekben részletesebben olvashatnak portálunkon.

Jakus Ágnes