Google je i službeno priznao da ima problema sa svojim prevoditeljskim alatom Google Translate, a koji se mogu opisati jednostavnim izrazom „garbage in, garbage out“.
Naime, Google Translate „uči“ prevoditi na temelju već postojećih prijevoda raznih siteova na Internetu. Ideja je da „proučavanjem“ takvih prijevoda programski algoritam Google Translatea s vremenom postane pametniji i bolji u prevođenju, kako bi njegovi prijevodi postupno bivali sve savršeniji.
No događa se upravo suprotno: velik broj siteova od kojih Google Translate „uči“ prevoditi zapravo su prevedeni samim Google Translateom, pošto njihovi vlasnici nisu angažirali stručne prevoditelje nego su iskoristili taj besplatan alat. Tako se događa da Google Translate zapravo uči od samoga sebe: u svoju bazu podataka unosi gomilu nekvalitetnih prijevoda što za posljedicu ima da nazaduje u učenju automatskog prevođenja. Zbog toga kvaliteta prijevoda s vremenom može postati sve gora, odnosno u najboljem će slučaju biti na razini kakva je i sada.
Peter Norvig, Googleov direktor istraživanja, o tome je nedavno govorio na konferenciji u Stanfordu, potaknut pitanjem jednoga od sudionika konferencije.
„To još nije postao velik problem, ali bi moglo biti sve gore. Uvijek procjenjujemo kvalitetu siteova pa na temelju toga skupljamo uzorke prijevoda. Ako site izgleda dobro, preuzet ćemo prijevod; ako izgleda loše, zaobići ćemo ga“, izjavio je.
Inače ovaj problem bio je jedan od razloga zbog kojih je Google svojedobno ukinuo Google Translate API, kako loši i nekvalitetni prijevodi ne bi „zagadili“ Internet pa Googleov automatski prevoditelj ne bi imao na temelju čega učiti prevoditi.
Odgovori