| H-1173 Budapest, Pesti út 8-12.,
| Telefon: +36 (1) 202-0202, +36 (1) 224-0920 | E-mail: multi@lingua.hu
  
  

Legfrissebb híreink




Gépek a fordítás útvesztőjében: az egyetemes megértés álma

A világ első, nyelvek közti fordításra alkalmas gépét 1954 elején mutatták be a Georgetown Egyetem és az IBM kutatói. Az azóta Georgetown-IBM kísérletként elhíresült projekt keretei közt egy „elektronikus agyat” hoztak létre, amely orosz mondatokat fordított le angolra.


Az alkotók hittek abban, hogy egy egyetemes fordítógép létrehozása – ha valaha is sikerülne – nem csupán az amerikai nép számára jelentene biztonsági hálót a szovjetekkel szemben, de a nyelvi korlátok eltörlésével a világbékét is előmozdítaná.

Hittek továbbá abban is, hogy az már áttörés küszöbén állnak. Az IBM-mel való együttműködést Leon Dostert, a Georgetown Egyetem nyelvésze kezdeményezte. Akkoriban úgy nyilatkozott, hogy az emberek számára akár már öt éven belül is elérhetővé válhatnak olyan gépi fordítók, amelyek több nyelv között is képesek lesznek fordítani.

Ám a folyamat végül sokkal lassabbnak bizonyult. (Valójában olyan lassúnak, hogy a kutatás megálmodói körülbelül egy évtizeddel később vizsgálatot indítottak, hogy fényt derítsenek az eredménytelenség okaira.) Több mint hatvan évvel később az áhított valós idejű gépi fordító – mint amilyen C-3PO a Star Wars szériából, vagy a Galaxis Útikalauz stopposoknak című könyv Bábel-hala volt – még mindig várat magára.

Vajon milyen messze állunk a megjelenésüktől a valóságban? A szakértői vélemények megoszlanak. Ahogy a gépi tanulás esetében oly gyakran láthatjuk, ez a kérdés is annak függvénye, milyen gyorsan tudjuk beprogramozni a gépeket az emberi gondolkodás imitálására.

Vikram Dendi szerint már közel a megoldás.

„Jó érzés itt állni, visszatekinteni, és azt mondani: valóra váltottuk a tudományos fantasztikumot” – nyilatkozta az All Technek Dendi, a Microsoft Research főnökének technikai és stratégiai tanácsadója.

A Microsoft fordítással foglalkozó munkacsoportjainak már sikerült kifejleszteniük olyan alkalmazásokat, amelyek nemcsak szöveget szövegre, de akár hangot hangra, vagy hangot szövegre is fordítanak. Az idei év legnagyobb vívmánya a Skype Translator volt. Ez az eszköz videóra veszi amit mondunk, és ezzel egy időben készít hozzá írott vagy hangalapú fordítást. A szolgáltatás jelenleg hét nyelven érhető el.

Persze korántsem a Microsoft az egyetlen vállalat, amely dolgozik a kérdésen. A Voxox nevű, internetes hívásokkal és chat-szolgáltatással foglalkozó cég például szöveget szövegre fordító funkciót is biztosít az üzenetküldő alkalmazása részeként. És ott van persze a Google is a maga hasonló, szövegalapú fordítómotorjával. A társaság nemrég mutatott be egy bővítményt, amelynek lényege, hogy a telefon kamerájának segítségével olvas be és fordít le idegen nyelvű szövegeket.

Mesterséges intelligencia

Az elmúlt évtizedek során a tudomány nyelvészeti- és technológiai akadályok egész sorát hárította el. A kutatók végül eljutottak egy új megközelítéshez, a mesterséges ideghálózatokhoz. A módszer lényege, hogy a gépeket az emberi gondolkodás mintájára programozzák, amivel tulajdonképpen az agy ideghálózatának mesterséges modelljét hozzák létre.

Az idegsejteket az ember környezetének legkülönbözőbb aspektusai aktiválják, beleértve a szavakat is. Minél több időt tölt valaki egy adott környezetben, annál fejlettebbé válik az ideghálózata.

A mesterséges ideghálózatok működési elve, hogy a gépek minden egyes szót a lehető legegyszerűbb formává, egy vektorrá alakítanak. Ez a vektor a biológiai ideghálózatokban működő neuron mesterséges megfelelője. Információt hordoz nemcsak az egyes szavakról, de a mondat vagy szöveg egészéről is. A gépi tanulás alapvetése – amely az évek során önálló tudománnyá nőtte ki magát – az, hogy minél több fordítást készít egy fordítómotor, annál sikeresebb eredményeket produkál, mindezt korlátozott emberi segítséggel.

Noha a gépek ma már képesek a „tanulásra”, hasonlóan az emberekhez, akadnak még nehézségek – nyilatkozta Yoshua Bengio, a Montreali Egyetem informatika professzora, aki maga is tanulmányozza a mesterséges ideghálózatokat. A nehézségek egyike rögtön a szükséges adatmennyiség. Egy gyermeknek sokkal kevesebb információra van szüksége ahhoz, hogy elsajátítson egy nyelvet, mint egy gépnek.

„A gépi fordítás hihetetlen mennyiségű adatot és számítást igényel, nincs hát semmi értelme” – mondta Bengio. Ennek ellenére, a mesterséges ideghálózatok koncepciója ígéretes. „Van rá lehetőség, hogy elérjék az emberi szintű teljesítményt. Csupán a szavak, a párbeszédek értelmére kell összpontosítanunk.”

Ez a módszer a gépi fordítás korábbi megközelítéseiből táplálkozik.

Még kezdetben, a kutatók úgy próbálták beprogramozni a gépi fordítókat, hogy manuálisan vittek be minden egyes nyelvtani szabályt minden egyes nyelvkombinációhoz, amellyel dolgozni akartak. Ha például egy melléknév az oroszban a főnevet követte, az angolban viszont megelőzte azt, a gép tudta, hogy fel kell cserélnie a sorrendet.

A gépi fordításhoz több számítógépes parancs szükséges, mint „egy irányított rakéta szimulációjához” – hangzott el a Georgetown-IBM kísérlet részleteit taglaló sajtótájékoztatón, 1954-ben.
A módszer tehát hamar érdektelenné vált, a nyelvpáronként is óriási mennyiségű szabály és kivétel tükrében.

A 80-as években aztán a kutatók a statisztikai alapú modell felé vették az irányt. A gépekbe nagy mennyiségű, ember által fordított anyagot tápláltak be (pl. ENSZ-szövegeket), és a gépek ezek alapján, önállóan azonosítottak mintákat, illetve szabályokat.

„Ehhez az ismétlődő szavak jelentették a kulcsot” – mondta Kevin Knight, a Dél-Kaliforniai Egyetem professzora. „Például, ha nagyobb mennyiségű angol-spanyol dokumentum áll rendelkezésére, a számítógép látni fogja, hogy ahol a spanyolban a 'banco' szó szerepel, ott angolul a 'bank' vagy 'bench' áll.”

A számítógép végül kikövetkezteti, hogy ha a ’banco de’ szavakat látja a spanyol oldalon, akkor kihúzhatja a ’bench’ szót az angol lehetőségek listájáról, mivel a ’the bank of’ kifejezés jellemzően egy pénzügyi intézetre utal.

A mesterséges ideghálózat próbája

A mesterséges ideghálózatok népszerűsége a XXI. század gépi fordítás kutatásában hozzájárult a gépi fordítók minőségi fejlődéséhez. Ma a fordítómotorok minden egyes szóról egyre több információt tárolnak el, és valószínűségi elemzéseket futtatnak, annak érdekében, hogy elkerüljék a természetellenesen hangzó megoldásokat.

A mesterséges ideghálózatok népszerűsége a XXI. század gépi fordítás kutatásában hozzájárult a gépi fordítók minőségi fejlődéséhez. Ma a fordítómotorok minden egyes szóról egyre több információt tárolnak el, és valószínűségi elemzéseket futtatnak, annak érdekében, hogy elkerüljék a természetellenesen hangzó megoldásokat.

De mennyire hatékony ez a megközelítés? Eldöntöttem, hogy elviszem a Skype Translatort egy „próbakörre”, hisz ez az alkalmazás szintén a mesterséges ideghálózatok elvén működik.

Videohívással kapcsolatba léptem Skype-on a Microsoft munkatársával, Olivier Fontanával. Fontana franciául üdvözölt. Néhány pillanat múlva egy férfi robothang elkezdte lefordítani a szavait angolra. Erősítésként elhívtam magammal Caroline Kellyt is, az NPR [amerikai közszolgálati rádió] ügyeletes francia szakértőjét. Szerinte a Skype jóval folyékonyabban fordított angolról franciára, mint fordítva.

Az eredmények végül meglepően pontosnak bizonyultak. Főleg mikor olyan témák kerültek terítékre, amelyekről a rokonainkkal tipikusan beszélgetnénk, pl. nyaralási tervek.

Mint minden videokonferencia, ez a tesztbeszélgetés is a jó internetkapcsolat függvénye volt. Ez segítette a gépet abban, hogy kiszűrje a szövegből a nevetéseket, hümmögéseket, és a fölösleges ismétléseket.

A fordítás akkor vált zavarossá, amikor a Skype Translator tudományos és technikai hátteréről kezdtünk beszélgetni - vagy legalábbis, próbáltunk beszélgetni. A gép többek közt nem volt hajlandó különbséget tenni a francia „hip-hop” és „iPhone” szavak között.

A hangról hangra való fordításban a szavak hangzása még jobban megbonyolítja a gépi fordítást, hisz a gépnek nem csak a fordításokat kell pontosan elvégeznie, de fel kell ismernie a nevetést, a dadogást, az ismétlést és az akcentusokat is.

Ám ahogy a szakemberek mondják, minél többet használjuk a fordítómotorokat, azok annál jobbá válnak. A mesterséges ideghálózatok valódi „áttörést hoztak”, – magyarázta Dendi, a Microsoft munkatársa.

„Nélkülük a Skype Translator ma is csak a science-fiction egyik ábrándja volna” – mondta.

Más szóval, nem tudhatjuk, milyen messzire juthat a gépi fordítás, ha a mesterséges és az emberi intelligencia találkozik.

További információk itt olvashatók. Az eredeti cikk szerzője Anne Li.


Legfrissebb híreink

Újabb megdöbbentő hatása lehet a Brexitnek - erre kevesen gondolhattak

Nagy-Britannia uniós tagságának megszüntetésével kikerülhet az angol az Európai Unió hivatalos nyelvei közül - figyelmeztetett hétfőn Danuta Hübner, az Európai Parlament alkotmányügyi bizottságának vezetője.

Gépek a fordítás útvesztőjében: az egyetemes megértés álma

A világ első, nyelvek közti fordításra alkalmas gépét 1954 elején mutatták be a Georgetown Egyetem és az IBM kutatói. Az azóta Georgetown-IBM kísérletként elhíresült projekt keretei közt egy „elektronikus agyat” hoztak létre, amely orosz mondatokat fordított le angolra.