Traduzzjoni awtomatika
Traduzzjoni awtomatika tirreferi għat-traduzzjoni ta’ test mill-lingwa oriġinali (jew lingwa sors) fil-lingwa mira permezz ta’ programm tal-kompjuter. It-traduzzjoni awtomatika hija eżempju ta’ l-intelliġenza artifiċjali bil-kompjuter.
Filwaqt li t-traduzzjoni umana tifforma parti mill-lingwistika prattika, it-traduzzjoni awtomatika hija parti mir-riċerka ta’ l-IT u l-lingwistika tal-kompjuter. Programmi tat-traduzzjoni bil-magni per eżempju bdew jinkitbu għall-ewwel kompjuters fis-snin erbgħajn.
Il-ħolma umana
Li wieħed jifhem lingwa bla ma jitgħallima hija l-eqdem ħolma umana (Tower
of Babel, J.Becher’s numeric Interlingua, Babel fish, Pentecost, stejjer
tal-finzjoni xjentifika). L-invenzjoni tal-kompjuter flimkien mal-fenomenu
tal-lingwa bħala dixxiplina xjentifika ħolqot, għall-ewwel darba, opportunitajiet
konkreti sabiex din il-ħolma tiġi rrealizzata.
L-istorja
Sal-ġurnata tal-lum l-interess militari affettwa b’mod deċiżiv l-iżvilupp
ta’ traduzzjoni awtomatika. Wieħed mill-ewwel proġetti kien programm
tat-traduzzjoni bejn ir-Russu u l-Ingliż għall-militari ta’ l-Istati
Uniti ta’ l-Amerika. Il-kwalita tiegħu ma kienetx waħda tajba iżda permezz
tiegħu setgħet, għall-ewwel darba, tinħoloq impressjoni dwar il-kontenut
ta’ dokumenti Russi mingħajr il-bżonn ta’ terzi persuni (interpreti u
tradutturi).
Ir-rapport ALPAC, imħejji għall-Pentagon, fl-1966 ikkontesta l-użu ta’
traduzzjoni awtomatika u r-riċerka waqfet għal kważi għoxrin sena sħaħ.
Ir-riċerka bdiet mill-ġdid fis-snin tmenin minn kumpaniji ta’ l-elettriku
bħal Siemens AG (proġett ta’ l-elettriku). Fl-istess waqt, il-gvern Ġappuniż
beda l-Proġett tal-Ħames Ġenerazzjoni fejn it-traduzzjoni awtomatika mill-Ingliż
għall-Ġappuniż kienet ibbażata għall-ewwel fuq lingwa ta’ l-ipprogrammar
Prolog. Il-kollaborazzjoni sħiħa bejn Universitajiet, kumpaniji elettriċi
u l-gvernijiet waslet għall-ewwel programmi ta’ traduzzjoni bil-magni kummerċjali
għall-kompjuters onlajn. B’hekk il-Ġappun sar il-mexxej fir-riċerka ta’
traduzzjoni awtomatika. Fis-snin disgħajn il-proġett ewlieni tal-BMBF,
Verbmobil ġie nstallat fil-Ġermanja. Dan bil-għan li jinterpreta djalogu
fil-Ġermaniż, Ingliż u Ġappuniż. Is-sistema Verbmobil kellha l-irwol li
tagħraf diskors spontan, ta’ l-analiżi tad-daħla, traduzzjoni, tħejjija
ta’ sentenzi u “say it out loud”.
Il-ħsara tad-dotcom fis-snin 2000 u 2001 irrovinat ħafna kumpaniji
żgħar tat-traduzzjoni awtomatika. Fl-industrija tas-softwer tat-traduzzjoni
awtomatika tal-lum il-ġurnata insibu biss bejn 10 u 20 kumpaniji li għadhom
attivi (ħafna programmi huma liċenzjati), jiġifieri t-traduzzjoni awtomatika
qed tiġi żviluppata primarjament fl-Universitajiet.
Fis-suq tat-traduzzjoni, id-dħul mill-applikazzjoni tat-traduzzjoni awtomatika
huwa ta’ 1% biss. Jeżistu iżda diversi raġunijiet għaż-żieda fid-domanda
għal applikazzjonijiet tat-traduzzjoni awtomatika:
- Ħafna testi huma provvduti diġitali (għalhekk huwa faċli għall-kompjuter biex jaħdem fuqhom)
- Il-globalizzazzjoni tirrikjedi t-traduzzjoni ta’ aktar u aktar testi f’aktar u aktar lingwi (is-suq tat-traduzzjoni jirdoppja kull erbgħa snin), waqt li l-popularità tal-professjoni tat-traduttur/interpretu qed tonqos.
- Lingwi, li huma diffiċli li wieħed jitgħallem, jew li huma rari mitkellma mill-Ewropej tal-Punent/l-Amerikani, u li dawk li jitkellmu dawn il-lingwi ftit li xejn jitkellmu lingwi tal-Punent, qed isiru dejjem aktar importanti:
- Lingwi ta’ l-Asja tal-Lvant, bħal ma huma ċ-Ċiniż, il-Korean u l-Ġappuniż qed jiżdiedu fl-importanza kummerċjali tagħhom
- Lingwi b’importanza għall-Militar f’reġjuni internazzjonali ta’ kunflitt, primarjament dawk li jinvolvu l-militar Amerikan. Fl-2003, diversi kumpaniji tas-softwer Amerikani ħarġu programmi tat-traduzzjoni ta’ l-Għarbi u l-Paschtu (lingwa fl-Afganistan)
Metodi tat-traduzzjoni
Is-sistemi kollha tat-traduzzjoni awtomatika jużaw dizzjunarji bilingwali u għandhom moduli ta’ regoli bażiċi tal-grammatika. Il-metodi individwali iżda huma differenti ħafna.
L-aktar metodi importanti tat-traduzzjoni awtomatika huma:
- Diretta: Il-kliem tat-test sors jiġi tradott kelma b’kelma u fl-istess ordni tad-dizzjunarju fil-lingwa mira. Wara dan, l-ordni tal-kelma u l-inflezzjoni jiġu aġġustati skond ir-regoli tal-lingwa mira. Din hija l-eqdem u l-iżjed metodu ta’ traduzzjoni awtomatika sempliċi li tifforma l-bażi tas-sistema tar-Russu-Ingliż imsemmija hawn fuq.
- Trasferiment: Il-metodu ta’ trasferiment huwa l-metodu klassiku tat-traduzzjoni awtomatika permezz ta’ tlett stadji: analiżi, trasferiment u ġenerazzjoni. Dan il-metodu ħa l-isem tiegħu mit-tieni stadju. L-ewwel tiġi analizzata l-istruttura grammatikali tat-test sors, ġeneralment fi struttura ta’ siġra. Struttura semantika hija derivata minn din l-analiżi, skond il-metodu ta’ trasferiment magħżul. L-istrutturi jiġu mbagħad trasferiti fil-lingwa mira. Fl-aħħar, sentenzi jerġgħu jiġu kreati mill-istrutturi permezz ta’ regoli grammatikali u b’hekk jiġi ġġenerat it-test mira.
- Interlingua: L-informazzjoni grammatikali mit-test sors tiġi l-ewwel espressa f’lingwa newtrali tan-nofs jew interlingua. L-informazzjoni grammatikali fil-lingwa mira tiġi kreata minn din l-interlingua. Il-metodu ta’ l-Interlingua huwa ta’ bżonn għat-traduzzjoni ta’ espressjonijiet kumplessi.
- EBMT: (Example-Based Machine Translation). L-applikazzjoni ċentrali tas-sistemi EBMT hija memorja tat-traduzzjoni fejn sentenzi u frażijiet spissi jiġu maħżuna fil-memorja tat-traduzzjoni rispettiva. Din is-sistema tikkalkula statistikament (permezz ta’ metodu ta’ l-irkupru ta’ l-informazzjoni), is-similarità bejn id-daħliet kollha fil-memorja tat-traduzzjoni u s-sentenzi rispettivi fit-test sors. It-traduzzjoni hija ġġenerata minn kombinazzjoni ta’ l-aktar sentenzi simili tradotti.
- SBMT: (Statistics-Based Machine Translation). Qabel issir it-traduzzjoni attwali, l-programm janalizza l-akbar u l-aktar korp ta’ test bilingwali varjat (per eżempju aġendi tal-Parlament). Dan jordna kliem u forom grammatikali fil-lingwa sors u mira skond il-frekwenza u l-prossimità tagħhom lejn xulxin. B’hekk jiġi ġġenerat dizzjunarju kif ukoll regoli grammatikali. It-testi jiġu tradotti fuq dan il-bażi. SBMT sar riċentament populari ħafna għax ma jirrikjedix għarfien tal-lingwa relatata. Vantaġġ ta’ SBMT hu li regoli li mhumiex deskritti eżatt f’termini tal-lingistika jkunu jistgħu jiġu nklużi permezz ta’ l-analiżi ta’ estratti tat-test reali. Il-kwalità tat-traduzzjoni hija ħafna inqas tajba minn dik magħmula minn sistemi bbażati fuq ir-regoli. Din is-sistema tiġi preferuta fil-Pentagon, għal lingwi li jeħtieġu sistema ta’ traduzzjoni awtomatika malgħajr, bla ma jkollhom ħin biżżejjed għall-ġabra ta’ regoli minn nies.
- HAMT: (Human-Aided Machine Translation). Minflok ma jħallu l-kompjuter jitraduċi d-dokument kollu, l-utent jiġi mitlub li jitraduċi jew li jnaqqas kostruzzjonijiet ambigwi jew ikkomplikati. Din tista ssir minn qabel billi l-utent jaqsam sentenzi f’dawk aktar qosra, per eżempju l-programm jistaqsi l-utent biex jagħżel it-tifsira meħtieġa tal-kelma.
Fil-prattika ħafna mis-sistemi jużaw taħlita ta’ dawn il-metodi (ġeneralment b’dominanza ta’ sistemi tat-trasmissjoni bl-interlingua u sistemi EBMT)
MAHT (Machine-Aided Human Translation), jiġifieri traduzzjoni bl-assistenza tal-kompjuter fejn programm tal-kompjuter jassisti traduttur uman permezz ta’ l-iċċekkjar awtomatiku tat-terminoloġija (tfittix awtomatiku fil-kompjuter). Tqabbil ta’ traduzzjonijiet li saru qabel (memorja tat-traduzzjoni), mhumiex inklużi bħala traduzzjoni awtomatika.
Dawn il-programmi huma ħafna drabi użati għal skopijiet ta’ divertiment, sempliċiment billi tieħu test u ddaħħlu f’magna tat-traduzzjoni għat-traduzzjoni fl-ilsien nattiv tiegħek.
Kif tista tiġi evalwata l-kwalità tat-traduzzjoni awtomatika?
Ir-riċerkaturi ta’ traduzzjoni awtomatika jużaw evalwazzjonijiet fuq bażi ta’ skali għad-determinazzjoni tal-kwalità tat-traduzzjoni. Traduzzjonijiet tat-traduzzjoni awtomatika jiġu evalwati sentenza b’sentenza u l-ammont totali standarizzat tas-sententi jiddeterminaw il-kwalità tat-test kollu. F’ħafna każi, l-evalwazzjoni tiġi magħmula minn kelliema nattivi tal-lingwa mira u espressa bħala indiċu. Fil-Ġappun tiġi użata skala b’punti minn 0-4:
- 4 punti: Komprensiva ħafna, kważi perfetta, bla żbalji
- 3 punti: Xi kelma jew tnejn ħżiena, il-kumplament tajba
- 2 punti: Possibbli li tiddetermina t-tifsira oriġinali
- 1 punt: Is-sentenzi ma jaqblux mat-tifsira oriġinali- Dan minħabba traduzzjoni parzjalment jew kompletament żbaljata.
- 0 punti: Is-sentenza ma tagħmilx sens, qisha arranġament imgerfex ta’ kliem, poġġuti flimkien b’ħafna żball.
Għal traduzzjonijiet twal, riċerkaturi tat-traduzzjoni awtomatika jużaw algoritmi ta’ evalwazzjoni awtomatika, li hija wkoll ibbażata fuq il-qawwa umana tal-ġudizzju.
Aspettattivi għoljin wisq?
Aħna l-bnedmin għandna aspettattivi għoljin wisq u għalhekk ma nkunux
sodisfatti bit-titjib attwali fir-riċerka ta’ traduzzjoni tal-magna.
Waħda mill-kondizzjonijiet
ta’ traduzzjoni awtomatika funzjonali hija li t-test sors ikun jista
jinqara u li anke persuna tkun tista tlesti traduzzjoni fid-dettall tat-test.
Kif
jista kompjuter ikun mistenni li jifhem u jitraduċi lingwa li persuna
oħra ma tifhimx? Ħafna lingwisti jassumu li meta wieħed jifhem il-lingwa
kompletament,
jifhem ukoll l-intelliġenza umana kollha. Uħud minn nies huma ta’ l-opinjoni
li sistema perfetta tat-traduzzjoni awtomatika għandha tkun simulazzjoni
tal-proċessi intellettwali umani. Kif inhu msemmi hawn fuq, wieħed mill-vantaġġi
ta’ SMBT hija li din il-problema qed jaħdmu fuqha, minħabba li s’issa
għadhom jistgħu isiru deduzzjonijiet ta’ regoli bla tifsira.
Problemi prattiċi
Jeżistu anke raġunijiet tanġibbli u parzjalment rimedjali għalfejn il-kwalità tat-traduzzjoni awtomatika ħafna drabi ma tkunx waħda tajba:
- „Programmi rħas“ Ħafna nies jiġġudikaw il-qagħda tat-traduzzjoni awtomatika permezz ta’ għodda għat-traduzzjoni awtomatika li huma provduti fuq l-Internet fuq Yahoo! jew Google per eżempju.
- L-utenti jifhmu l-lingwa sors Speċjalment fit-traduzzjonijiet bejn lingwi tal-Punent, l-utent jifhem xi ftit jew wisq il-lingwa sors, u għalhekk għandu jagħraf diskrepanzi aktar minn dak li jserraħ biss fuq il-magna tat-traduzzjoni.
- Stil tal-lingwa Kull stil ta’ lingwa fih l-istramberiji tiegħu li mhumiex deskritti fil-lingwistika. Sistemi ta’ traduzzjoni awtomatika huma kważi dejjem ibbażati fuq lingwa miktuba fil-gazzetti. Sistemi ta’ traduzzjoni awtomatika jwasslu għal riżultati ħżiena meta jitraduċu testi li mhumiex magħmula għalihom, bħal diversi testi litterarji, diskors jew ġieli anke testi tekniċi (per eżempju f’manwali ta’ struzzjonijiet mill-Ġappun li jiġu tradotti awtomatikament)
- Nuqqas ta’ varjetà ta’ suġġetti. It-traduzzjoni awtomatika huwa qasam tal-lingwistika tal-kompjuter, iżda ħafna riċerkaturi ġejjin minn dixxiplina waħda jew tnejn, jiġifieri mill-ixjenza tal-kompjuter jew mill-lingwistika, bla ebda għarfien suffiċjenti ta’ xi suġġetti rispettivi oħra. Filwaqt li l-lingwisti jkollhom, ħafna drabi, nuqqas ta’ prattika fil-programmazzjoni, xjentisti tal-kompjuter ma jkunux lesti li jaħdmu bil-fenomenu tal-lingwa. Għal din ir-raġuni, mudelli ta’ lingwa strutturali jifformaw il-bażi ta’ ħafna mill-applikazzjonijiet tat-traduzzjoni awtomatika u dawn ma jikkonsidrawx it-tfittix fil-lingwistika f’dan l-aħħar 50 sena.
- Ma jsirx tpartit bejn l-industrija u l-akkademji. Kumpaniji kummerċjali tat-traduzzjoni awtomatika ġieli jippreferu jimpjegaw programmaturi li għandhom kompetenza prattika milli riċerkaturi ta’ traduzzjoni awtomatika li l-interess tagħhom jitqies bħala mhux importanti.
- Dizzjunarju żgħir wisq u/jew mhux eżatt. Minħabba l-bidliet li qed isiru fis-soċjetà u x-xjenza, l-vokabularju tal-lingwa qed jiżdied b’rata mgħaġġla kuljum. Hafna kliem għandu wkoll aktar minn tifsira waħda, u d-differenza bejniethom tinsab permezz ta’ analiżi kuntestwali. Żbalji fid-dizzjunarji, bħal dawk fir-Russu-Ingliż, huma responsabbli għal perċentaġġ sorprendenti ta’ traduzzjonijiet inferjuri. Il-programmi l-kbar tat-traduzzjoni awtomatika għandhom dizzjunarji b’milljuni ta’ daħliet u varjetà ta’ tifsiriet differenti. Il-kumpilazzjoni dettalljata u bla żbalji ta’ dawn id-dizzjunarji kbar għal applikazzjonijiet tat-traduzzjoni awtomatika permezz ta’ lessikografija hija spiża kbira wisq għal kumpaniji żgħar.
- Nuqqas ta’ regoli tat-trasferiment. Diversi fenomeni grammatikali jvarjaw sew minn lingwa għall-oħra, jew huma preżenti biss f’ċerta lingwi. Is-soluzzjoni ta’ dawn il-problemi tirrikjedi riċerka lingwistika, kumpaniji tat-traduzzjoni awtomatika jippruvaw inaqqsu dawn l-ispejjeż.
- Problemi komputazzjonali fil-lingwistika. Traduzzjoni awtomatika tinvolvi ħafna problemi oħra li jsiru wkoll f’applikazzjonijiet komputazzjonali fil-lingwistika, per eżempju, li tifhem għarfien ta’ l-enċiklopedija.

