Van-e még szükség fordítókra a Google Translate világában?

Hírek2020. jan. 19.Növekedés.hu

A világ legismertebb online fordító alkalmazása ma már 105 nyelvet kezel egyre pontosabban, nem csoda, hogy napi 200 millió felhasználója naponta 150 milliárd szót fordít le vele. Eljöhet az idő, amikor az alkalmazás teljesen kiváltja a fordítókat? Az egzisztenciáját is védő tolmácsszakma szerint még nem tartunk itt.

Magyarország férfi kézilabda válogatottja fantasztikusan kezdett a 2020. januári Európa-bajnokságon. A mieink igazán kemény csoportba kerültek ugyan, Izland, Dánia és Oroszország, vagyis Európa-, világ- és olimpiai bajnok nemzeti csapatok kerültek velünk egy csoportba, de nagy meglepetésre a fiatal magyar titánok veretlenül megnyerték a csoportot.

De vajon hogy fogadták a nagy győzelmeket ellenfeleink hazájában? Ma már nem is olyan nehéz ezt ellenőrizni. Előbb csak meg kell keresni a vonatkozó dán, orosz és izlandi cikkeket, majd le kell őket fordítani magyarra.

Elő a fordítóprogrammal!

A Google Translate program mindenben segít nekünk. Ha a vonatkozó cikkeket keressük, előbb érdemes megtalálni azokat, ehhez a „Magyarország” és a „kézilabda” szavakat érdemes az adott nyelvre lefordítani, majd beütni a keresőbe. Ez a két kifejezés

dánul Ungarn és håndbold,

izlandi nyelven Ungverjaland és handbolta,

oroszul Венгрия (Vengrija) és гандбол (gandból).

Ha megvannak a megfelelő kifejezések és megtaláltuk a cikkeket, akkor a programmal visszafordíthatjuk azokat (akár a cikk linkjének beütésével, akár a megfelelő szöveg kimásolásával) magyarra.

A profik azt javasolják, hogy aki beszél angolul, annak érdemes mindent angolra fordítani, ezen a nyelven a legjobbak ugyanis a szövegek.

Hihetetlen térhódítás

A fordító program ilyen, vagy olyan szinten, de már 2006 óta működik, mára 500 millió ember tekinthető a felhasználójának, naponta átlagosan 200 millióan valóban használják is, és becslések szerint egyetlen nap 150 milliárd szót fordítanak le a segítségével.

E sorok írásakor az alkalmazás éppen 105 nyelvet kezel, mondhatjuk, hogy amely nyelveket mi magyarok valamennyire is ismerünk, azokat vélhetően a Google Translate is kezeli, talán egyedül a lovári (egy itthon is elterjedt cigány nyelv) tekinthető olyannak, amelyet Magyarországon pár tízezren ismernek, de a fordítóprogram nem tartalmazza. Természetesen a 7000 ma ismert, aktívan használt nyelvből azért sokat nem ismer.

A 12 nagy és a sok kicsi

A globalizált világban még ma is meglepően szórt, hogy melyik nyelv hány embernek az anyanyelve. A 12 legnagyobb nyelv (az angol, az arab, a bengáli, a francia, a japán, a kínai, a német, az olasz, az orosz, a portugál, a spanyol és az urdu) a világ lakosságának kétharmadát lefedi.

Ám, ha belegondolunk, rengeteg embernek más az anyanyelve. Európában is szinte minden népnek saját nyelve van (például küln nyelv a luxemburgi, a montenegrói, a szlovén, a walesi, hogy pár kisebbet említsünk). Arról nem is beszélve, hogy Indiában, vagy Afrikában több száz különböző hivatalos nyelv van „forgalomban”, egy-egy nagyobb államban még tartományonként is eltérő leoszlásban. 

Pár érdekesség

Ha megnézzük, hogy a Google fordító által kezelt nyelvek között milyeneket látunk, a legtöbb azért valamennyire ismerős lesz, de azért egyáltalán nem biztos, hogy sokan tudják, hogy például a gudzsaráti, a xhosza, a szindhi, a szebuánó és a sona hol használatos.

A megfejtés egyébként

a gudzsaráti 46 millió ember anyanyelve India nyugati részén,

a xhosza a Dél-Afrikai Köztársaság egyik hivatalos nyelve, a zulu után a második legtöbb embernek ez az anyanyelve az országban,

a szindhi, Pakisztánban és Indiában 25 millió ember anyanyelve,

a szebuánó egy ausztronéz nyelv, 21 millió fülöp-szigeteki beszél így,

a sona pedig Mozambikban, Zambiában, illetve Botswanában használatos, egy bantu nyelv, de ezt is azért legalább annyian beszélik, mint a magyart.

Hogy fordít?

A 2006-ban angol, orosz, kínai és arab nyelven elinduló Google Translate eredetileg egyfajta mechanikus gépi fordítást végzett, de azzal igyekezett tökéletesíteni a szövegeit, hogy azokat rendre összevetett profi fordításokkal, elsősorban az ENSZ és az Európai Unió sok nyelvre lefordított szövegeit mintául véve.

A minőségi ugrást aztán 2016 hozta el, voltaképpen azóta terjedt el a mindennapokban a program, amikor a Google bejelentette, hogy közel 60 százalékkal tudta csökkenteni a hibaarányt. Az új NMT (neural machine transpaltion) elnevezésű rendszer a nyelveket, mint vektorok sorozatát kódolja, egész mondatokat fordít le egyszerre, és ez sokkal jobb szövegeket eredményezett. az algoritmus tanul is, folyamatosan javítja maá az interneten fellelhető szövegek alapján.

Leválthatja a tolmácsokat?

Ha rákeresünk, hogy a hivatásos fordítók, a tolmácsirodák miképpen vélekednek a programról, eléggé lesajnáló véleményekkel fogunk találkozni. A semminél jobb, de nem sokkal, egy-egy szó megkereshető benne, de a szövegek értelmetlenek, nem követik az adott nyelv szabályait.

Ebben biztosan van igazság, de azért az 500 millió felhasználó aligha önsorsrontásból tart ki a program mellett. A cég folyamatosan fejleszt, bár sokkal nehezebb az élő szót dekódolni, de már vannak élőhangos fordító verziók is. De természetesen az igaz, hogy továbbra is probléma az, ami az írott szövegekben is: az élő nyelv csodálatos dolog, rengeteg verzióval, változattal, szlenges kifejezéssel, a gép még mindig, milliárdnyi minta után is képes tévedni.

Vicces hibák

Ha szerb ortodoxokról olvasunk, akkor a Metropolitan Jurij nem nagyvárosi Jurij, ahogy a program fordítja, hanem egy Jurij nevű főpap, ha Roman Abramovicsról fordítunk szöveget, akkor a Roman egy keresztnév és nem azt jelenti, hogy a római Abramovics.

Az internet tele van ezekkel a gyűjtésekkel és a gépi algoritmusok természetesen sokszor tényleg tévednek. Az ukrán nyelvi programban az „oroszokra”, az oroszokkal kapcsolatos elnevezésekre rémes kifejezéseket kaphatunk, nem kizárt, hogy egyszerűen annyiszor találkozott ezekkel a szövegkapcsolatokkal így a program, hogy eltanulta.

Némi átolvasással

Magyar a rák szó közvetlen fordítása cancer, de ez a betegség, ha pedig már sült rákot írunk a programba, akkor az a program szerint is roasted crab.

Tükörfordításra, minőségi munkára ma még nem feltétlenül alkalmas a program, hiszen nem értheti meg mindig a finom iróniát, amikor más az „okosan oldja meg”, vagy „okosban oldja meg”.

Ám a program egyre jobb. és, ha valaki beszél ugyan angolul, de számára könnyebbség, ha inkább magyarul fogalmaz, jobb szöveget fog kapni, ha Google fordítóval fordítja le angolra a hibátlan magyar szövegét, és azt angolul átolvasva, javítgat, mintha maga próbálkozna a saját „konyhai angoljával.

A fordítók és a tolmácsok ma még biztonságban vannak, de azért igazán nyugodtan hátradőlni már nem tudnak.