четвртак, 9. фебруар 2012.

GOOGLE TRANSLATE KAKO JE TO NEKAD RADIO


Google, ili Veliki Brat kako ga neki zovu, jedan je od onih koji nam nude besplatni servis, servis masinskog prevoda dokumenata i sajtova. Svi smo se susreli sa situacijama kada prevod samo komplikuje zivot umesto da pomogne…malo smo se nasalili na temu, kako to ide kada masine preuzmu…uskoro cemo srediti ovaj tekst, bez panike.

Svako ima svoju priču o strašnim prevoda reći – meni nerazumljiv meni restorana u Hrvatskoj, komično nepismen znak upozorenja na francuskoj plaži. „Human-inženjer“ prevod je kao što je nedovoljna na važnijim domenama. U našim sudovima i bolnicama, u vojne i sigurnosne usluge, te nedovoljno plaćen preopterećeni prevoditelji bi muddles od milijun od vitalnog interakcije. Mehanicko prevođenje svakako može pomoći u ovim slučajevima. Njegov legendarni Bloopers često nema gore od pogrešaka koje je pod velikim pritiskom ljudi.

Mehanicko prevođenje korisno je dokazao u više hitnim situacijama kao dobro. Kad Haiti je uništen u potresu u siječnju, pomoći momčadi ulijeva se raspalo otoka, govoreći desetaka jezika – ali ne Haićanski kreolski. Kako bi preživjela s zarobljen Još se korisna informacija spasitelja? Ako on je morao čekati kineski ili turski ili engleskom jeziku tumač okrenuti da bi mogao biti mrtav prije nego što se podrazumijeva. Carnegie Mellon University odmah objavio svoje Haićanski kreolski govori i tekstualnih podataka, te mreža volonterskih developera proizvedene efikasan sustav za strojno prevođenje Haićanski kreolski u nešto više od dugog vikenda. Nije se proizvoditi proze velike ljepote. Ali to radio.

Prednosti i nedostaci strojno prevođenje su predmet rasprave između povećanja ljudskih prevodioca/translatora u zadnje vrijeme zbog sve većeg korake je napravio u zadnjih godinu dana od najnovijih velikih sudionik u polju, Google Translate. Ali to zapravo počeo raspravu s rođenjem strojno prevođenje sama.

Potreba za sirovom naftom strojno prevođenje seže u početak hladnog rata. Sjedinjene Države odlučile da je to skandirati što svaki bilješku ruskog dolaze iz Sovjetskog Saveza, i tu jednostavno nije bilo dovoljno prevoditelja pratiti (kao što nema dovoljno sada prevoditi sve jezike koje SAD želi nadzor). Vreme Hladnog rata poklopilo se sa izumom od računara, i „cracking ruski“ je bio jedan od prvih zadataka ovi strojevi su bili postavljeni.

Otac masinskog prevođenja, Warren Weaver, odabrao promatrati kao ruske „code“ zamagle pravi smisao teksta. Njegov tim i njegova nasljednika i ovdje u Europi protekao u zdravorazumsko način: prirodni jezik, kako oni računati, izrađen je od leksikona (skup riječi) i gramatika (skup pravila). Ako vam se mogao dobiti leksikona dvaju jezika unutar stroja (prilično lako) i dati mu cijeli skup pravila po kojima ljudi konstrukt smislene kombinacije od riječi u dva jezika (više dvojben prijedlog), onda bi se stroj mogao prevesti iz jedne „kod“ u drugi.

Akademska jezikoslovci toga vremena, Noam Chomsky glavni među njima, također su pogledali jezik kao leksikon i gramatika, u mogućnosti generirati beskonačno mnogo različitih rečenica iz konačnog skupa pravila. Ali, kao anti-Chomskyjev lingvista na Oxfordu komentirao u to vrijeme, tu su i beskonačno mnogo motor automobila koji mogu dolaze iz britanskog auto biljka, svaki onaj koji ima nešto different redu s njim. Tijekom sljedeća četiri desetljeća, strojno prevođenje postigao mnoge korisne rezultate, no, poput britanske auto industrije, ona je pala daleko od nade 1950.

Sada imamo životinje druge vrste. Google Translate je statističko strojno prevođenje sustava, što znači da ne pokušati birati ili ne razumiju ništa. Umjesto uzimanja kazne u komade, a zatim ga ponovo graditi u „target“ jezik kao sto je stariji stroj prevoditelja radio, Google Translate izgleda za slične kazne u već prevedene tekstove negdje vani na webu. Nakon što je pronašao najvjerojatnije postojeće utakmice kroz nevjerojatno pametan i brzo računanje statističkih uređaj, Google Translate je kašalj gore, sirovo ili, ako je potrebno, lagano kuha. To je kako to simulirati – ali samo simulira – ono što smo pretpostavimo se događa u glavi prevoditelja.

Google Translate, koja se do sada nositi 52 jezika, sidesteps lingvisti ‘teorijska pitanja o tome što je jezik, a kako to radi u ljudskom mozgu. U praksi, jezici se koriste za reći iste stvari ponovo i ponovo. Za možda i 95 posto svih iskaza, Google elektronske svraka je basnoslovan alat. No, tu su dva važna ograničenja koja korisnici ove ili bilo koje druge statističke strojno prevođenje sustava trebaju razumjeti.

Нема коментара:

Постави коментар