(原標(biāo)題:殺死那個(gè)人類同傳)
2018年9月20日,知乎上一篇圖文并茂的文章,將人們對(duì)“機(jī)器翻譯”的質(zhì)疑,再次置于放大鏡下。
文章作者Bell Wang,一名同聲傳譯工作者,指責(zé)著名的人工智能公司——科大訊飛在一場(chǎng)由他擔(dān)任同傳的會(huì)議上,沒(méi)打招呼,就直接把他和搭檔口譯的內(nèi)容語(yǔ)音識(shí)別成了文字并打到大屏幕上。而屏幕上顯眼的“訊飛聽見”logo,給了現(xiàn)場(chǎng)觀眾很大的誤導(dǎo),讓人以為這中文字幕是機(jī)器翻譯軟件直接翻譯得出的。
這篇文章迅速發(fā)酵,作為上市公司的科大訊飛不得不出面回應(yīng),強(qiáng)調(diào)自己“從沒(méi)有說(shuō)過(guò)要取代人類”,沒(méi)有主觀惡意。在連續(xù)的幾場(chǎng)發(fā)布會(huì)和新聞稿中,高深莫測(cè)的“人機(jī)耦合”概念再次被科大訊飛拿出來(lái),用于解釋他們的機(jī)器翻譯理念。
機(jī)器翻譯是為了幫助人類翻譯的,科大訊飛說(shuō)。
盡管如此,同傳界對(duì)科大訊飛的負(fù)面觀感,并未因此減退。
PingWest品玩采訪了多位同傳從業(yè)者,他們普遍對(duì)科大訊飛缺乏正面印象。這并是不來(lái)自“機(jī)器翻譯搶走人類飯碗”的擔(dān)憂,而是源于包括科大訊飛在內(nèi)的一眾“機(jī)器翻譯公司”,對(duì)同傳從業(yè)者“缺乏起碼的尊重“。
在這種糟糕的互動(dòng)關(guān)系背后,自人類有文明交流以來(lái)便出現(xiàn)的語(yǔ)言翻譯,正在走向兩個(gè)分岔路。
公然羞辱
2017年底,美國(guó)前總統(tǒng)奧巴馬來(lái)到中國(guó)參加了一場(chǎng)企業(yè)峰會(huì)。這場(chǎng)會(huì)議后來(lái)因大量流出的“微商握手奧巴馬”圖片而走紅。不過(guò)在這場(chǎng)走穴現(xiàn)場(chǎng),真正的主角是科大訊飛。
入行5年的同傳譯員喬亞(化名)是當(dāng)天會(huì)議的同傳之一。會(huì)議即將開始前,現(xiàn)場(chǎng)一片混亂,一名主辦方工作人員匆匆找到正在做最后準(zhǔn)備的喬亞和她的搭檔,說(shuō)“科大訊飛也會(huì)來(lái)”。主辦方告訴她們,科大訊飛在會(huì)上會(huì)把她們的同傳用語(yǔ)音識(shí)別技術(shù)展示在大屏幕上,提醒她們翻譯時(shí)要“小心一些”。
在當(dāng)天這場(chǎng)”寸時(shí)寸金“的活動(dòng)上,主辦方安排了多場(chǎng)路演,但由于時(shí)間把握的問(wèn)題,幾個(gè)講者在演講末尾不得不提高語(yǔ)速,最終快到同傳無(wú)法及時(shí)翻譯。“所以一個(gè)直接結(jié)果就是,當(dāng)時(shí)屏幕出現(xiàn)長(zhǎng)時(shí)間空白,不一會(huì)兒科大那邊就直接把屏幕關(guān)了?!?/p>
活動(dòng)結(jié)束時(shí)喬亞一度擔(dān)心自己的翻譯完成度,擔(dān)心客戶會(huì)不滿意。但接下來(lái)的一幕卻讓她更加憤怒:
活動(dòng)全部結(jié)束后,科大訊飛的一名高層突然蹦到臺(tái)上,對(duì)奧巴馬驕傲地說(shuō)到:“今天我們?cè)谄聊簧峡吹降膶?shí)時(shí)字幕,都是科大訊飛的翻譯技術(shù)做的同傳。”
而在當(dāng)天的活動(dòng)全程中,科大訊飛自始至終沒(méi)有和譯員有過(guò)任何接觸。
這樣的做法與Bell Wang在知乎熱文里吐槽的行為如出一轍,而PingWest品玩采訪的多名同傳都表示,自己也受到過(guò)相似的待遇。
張偉是一名從事同傳8年的譯員,他記得在至少兩次他同傳的活動(dòng)中,現(xiàn)場(chǎng)嘉賓在發(fā)言中突然脫稿說(shuō),如果他當(dāng)天帶來(lái)了自己公司的翻譯產(chǎn)品,就不需要今天的同傳了。而更加諷刺的是,作為現(xiàn)場(chǎng)的同傳,他還需要把這些言論翻譯成英文告訴老外觀眾。
“第一次遇到這種場(chǎng)景的時(shí)候我特別氣憤,但作為譯員我們要保持客觀,我還是給他翻了。當(dāng)時(shí)我和搭檔互相看了一眼,兩人滿臉的抵觸?!?/p>
如今國(guó)際化的科技大會(huì)越來(lái)越多,那些擁有翻譯技術(shù)的科技公司嘉賓,總是喜歡拿就在現(xiàn)場(chǎng)的人類同傳說(shuō)事,并且對(duì)這種近乎公然羞辱的行為自我感覺(jué)良好。
在接受采訪的多名同傳的描述中,這些機(jī)器與人共存的場(chǎng)合,沒(méi)有協(xié)同工作,也沒(méi)有同場(chǎng)競(jìng)技,有的只是荒謬的鬧劇, Bell Wang吐槽的這一次與他們經(jīng)歷的并沒(méi)有什么區(qū)別。唯一的不同只是,這一次事情“鬧大了”,不再只局限于同傳圈子。
“業(yè)內(nèi)的朋友們也開始在我身上寄托很多期望,希望維護(hù)合理的權(quán)利和訴求。” Bell Wang 在自己帖子引發(fā)巨大反響后這樣說(shuō)到。
“從業(yè)者越來(lái)越浮躁”
中國(guó)人對(duì)科技的熱衷,讓“AI取代人類”成了所有人掛在嘴邊的話題。說(shuō)的多了,許多”震驚體“的標(biāo)題,也開始被所有人嚴(yán)肅對(duì)待。
如今你時(shí)不時(shí)就會(huì)在網(wǎng)上看到“AI取代同傳”樣式的標(biāo)題,在張偉印象中,同傳圈第一次集體因此憤怒是2013年,當(dāng)時(shí)中國(guó)移動(dòng)的前董事長(zhǎng)王建宙在央視接受采訪,他強(qiáng)調(diào)4G帶來(lái)傳輸速度的飛躍將大大提升機(jī)器翻譯的速度,進(jìn)而替代人類同傳。
“如果4G讓做同聲傳譯的失業(yè)了,那我們這個(gè)行業(yè)就太高興了。” 王建宙隨口一說(shuō),同傳們焦慮許久。
小L是一名入行不到4年的年輕同傳,她的生活節(jié)奏代表了最典型的同傳譯員。我在她上下午兩場(chǎng)活動(dòng)的間隙見到她:一身嶄新西裝、腳踏高跟鞋,但依舊走路生風(fēng)。雖然過(guò)往一周每天都在“接會(huì)”(擔(dān)任會(huì)議的同傳),但在她化著淡妝的臉上卻看不到絲毫疲態(tài)。對(duì)這種快節(jié)奏的生活,她早已習(xí)慣?!斑@是做同傳的常態(tài)?!彼f(shuō)。
在大部分時(shí)間里,她都保持著職業(yè)的微笑,只是當(dāng)談及AI翻譯的話題時(shí),她皺起了眉。
在此次科大訊飛的風(fēng)波之前,機(jī)器翻譯就曾在主流輿論中引發(fā)過(guò)一次熱議。今年4月的博鰲亞洲論壇上,騰訊的機(jī)器同傳產(chǎn)品“翻譯君”高調(diào)亮相。
小L記得,在博鰲論壇開幕前,她以前合作過(guò)的一個(gè)客戶給她轉(zhuǎn)來(lái)一篇文章,內(nèi)容是騰訊為”翻譯君“亮相而發(fā)布的新聞稿,但題目則被多家自媒體改作“AI即將取代同傳”。
“他什么意思?以后不需要和我合作了?”小L心里想,當(dāng)時(shí)感到有點(diǎn)慌。不過(guò)之后的進(jìn)展讓她松了口氣。
在那個(gè)熱鬧的大會(huì)上,“翻譯君”僅用幾天時(shí)間就從“業(yè)界首個(gè)完整AI同傳服務(wù)”,迅速淪為一個(gè)錯(cuò)誤百出的蹩腳翻譯,諸如“我們需要一張臉,一張新的臉”的翻譯讓人哭笑不得,整體聽下來(lái)也是磕磕絆絆,基本無(wú)法通過(guò)它弄清楚現(xiàn)場(chǎng)在討論些什么。
小L覺(jué)得可笑,但緊跟而來(lái)的則是憤怒。
“同傳這個(gè)行業(yè)向來(lái)是靠實(shí)力說(shuō)話,你的翻譯水平、你的情商,都很重要。”小L說(shuō)?!暗F(xiàn)在突然間機(jī)器翻譯來(lái)了,誰(shuí)都還沒(méi)看過(guò)它們真的翻出什么成果,或者真的證明比我們?nèi)祟悆?yōu)秀,但是一瞬間我們所有人類同傳就是多余的了,連比較一下都不用。這感覺(jué)很不爽。”
小L2014年讀研期間開始跟著老師參加會(huì)議的同傳,正式入行。但畢業(yè)后的前2到3年,做為新人,每個(gè)月最差時(shí)可能就只有2到3場(chǎng)會(huì),天天都很著急?!懊恳粋€(gè)機(jī)會(huì)都要十分珍惜,如何讓客戶滿意,跟翻譯公司維護(hù)好關(guān)系,讓他們?cè)谙乱淮斡袝?huì)的時(shí)候能想起你。然后自己還要強(qiáng)迫自己每天都練習(xí)聽力和翻譯??傊Σ蝗菀??!毙回憶說(shuō)。
但同傳是翻譯行業(yè)的塔尖,而且同傳本身也是一個(gè)金字塔型的行業(yè),進(jìn)入頂端才有機(jī)會(huì),因此小L削尖了腦袋也要擠進(jìn)去?!拔覐牟慌潞屯瑢W(xué)、前輩競(jìng)爭(zhēng),有機(jī)會(huì)總是會(huì)觀察其他譯者,甚至是我的搭檔,從她們的長(zhǎng)處學(xué)習(xí),同時(shí)也知道他們的毛病在哪?!?/p>
而這一切到了機(jī)器翻譯那,卻可以不戰(zhàn)而勝。越來(lái)越多科技公司在宣傳時(shí)都把“同傳”當(dāng)成自己機(jī)器翻譯技術(shù)的靶子。
“很多時(shí)候機(jī)器犯的錯(cuò)誤對(duì)人類同傳來(lái)說(shuō)就是災(zāi)難,比如我看到過(guò)機(jī)器翻譯在一家公司年會(huì)現(xiàn)場(chǎng)把人家公司名稱翻錯(cuò),在國(guó)際論壇把地名翻錯(cuò),再比如博鰲這次,連一帶一路這樣的詞語(yǔ)也敢翻錯(cuò)?!毙說(shuō)。
她覺(jué)得,這與同傳整體的低調(diào)有關(guān):與坐在臺(tái)前和講者肩并肩的交傳不同,同傳往往“躲”在現(xiàn)場(chǎng)的某個(gè)角落,同時(shí)同傳譯員大多是自由職業(yè)者的工作狀態(tài),獨(dú)來(lái)獨(dú)往,競(jìng)爭(zhēng)激烈,沒(méi)有什么抱團(tuán)的習(xí)慣,也不太集體發(fā)聲。
“也許因?yàn)槲覀兛傋诮锹涞南渥永?,他們不知道我們的態(tài)度吧。所以這些公司總是把同傳做為宣傳中瞄準(zhǔn)的對(duì)象。但這些動(dòng)輒’替代同傳’的言論,其實(shí)是一種缺少尊重的表現(xiàn)。”小L說(shuō)。
“機(jī)器翻譯水平這么差,但還把同傳做靶子,也是因?yàn)橥瑐魇亲罡咚?,而且也算是一個(gè)高薪的工作,說(shuō)用機(jī)器取代我們會(huì)更有噱頭,有利于他們吸引關(guān)注。而且對(duì)于那些上市公司,還有利于抬升股價(jià)?!眴虂喺J(rèn)為。
而張偉則感到困惑,他從行業(yè)估值角度估算了一筆賬,認(rèn)為就算機(jī)器真能取代人類同傳,同傳這點(diǎn)市場(chǎng)也不值得科技公司花費(fèi)如此巨大的投入。
“我算了一下,同傳市場(chǎng)按照2000名譯員、每名譯員每年150場(chǎng)會(huì),每場(chǎng)按照現(xiàn)在平均水平,譯員5000元、翻譯公司拿另外的5000元,那這樣就是30個(gè)億。再加上同傳設(shè)備的租賃費(fèi)大約50個(gè)億,這已經(jīng)是很高的估計(jì),但也才多少?!睆垈フJ(rèn)為,就算把他估計(jì)的數(shù)字乘以10,也根本不值得這些科技公司大張旗鼓地做。
“我看,同傳這個(gè)概念算是被這些科技公司做市場(chǎng)營(yíng)銷的給‘綁架’了?!毙憤憤地說(shuō)。然而,盡管看不上機(jī)器翻譯現(xiàn)在的水平,但小L承認(rèn),她也不確定未來(lái)10年機(jī)器翻譯會(huì)發(fā)生怎樣的變化。
這種鋪天蓋地的宣傳已經(jīng)開始影響同傳行業(yè)里的每一個(gè)人。
喬亞目前還在一所高校兼職教授同傳課程,她記得在給一個(gè)研究生班上的第一節(jié)課上,這些未來(lái)的同傳主力軍關(guān)心的最多的話題也是“AI這么強(qiáng)大,我們還需要學(xué)習(xí)同傳么?要不要趁早改行”。這讓她哭笑不得。
而張偉認(rèn)為這很容易理解?!鞍凑宅F(xiàn)在這樣的發(fā)展,未來(lái)10年真的不好說(shuō)。而這些20多歲的學(xué)生,10年后正進(jìn)入事業(yè)黃金期,誰(shuí)都不想在那時(shí)候被機(jī)器取代,丟掉飯碗。”
一方面親眼看著如今機(jī)器翻譯的糟糕水準(zhǔn),但另一方面卻又停不住的感到擔(dān)憂,如此糾結(jié)往復(fù)成了同傳們生活的一部分,給本就壓力不小的生活平添更多煩惱。
小L發(fā)現(xiàn),這幾年關(guān)于AI取代人類同傳的討論已經(jīng)取代了所有與業(yè)務(wù)相關(guān)的討論,成為行業(yè)內(nèi)唯一持久的熱議話題。
“以前還安安靜靜討論討論接會(huì)和做翻譯的業(yè)務(wù)經(jīng)驗(yàn),現(xiàn)在網(wǎng)上和群里就都是討論AI又干了什么?!毙說(shuō)?!疤焯煜脒@個(gè),讓從業(yè)者都顯得越來(lái)越浮躁了。”
人類和機(jī)器互不理解
在瞄準(zhǔn)同傳這一行業(yè)的同時(shí),這些機(jī)器翻譯技術(shù)的研發(fā)者們對(duì)同傳的理解卻與擁有百余年發(fā)展史的同傳這一工種有很大不同。
在被問(wèn)及科技界對(duì)常常提到的“機(jī)器同傳”的定義,微軟首席語(yǔ)音科學(xué)家黃學(xué)東對(duì)PingWest品玩表示,他們的理解更多是指語(yǔ)音識(shí)別與機(jī)器翻譯的結(jié)合。他表示,如今在語(yǔ)音識(shí)別上由于抗噪的能力還有所限,這一點(diǎn)比人類是要差點(diǎn)。但機(jī)器翻譯方面,它的速度絕對(duì)是人類比不上的。
小L就認(rèn)為,同傳不是機(jī)械地翻譯,而是要保證溝通,達(dá)到交流的目的。“這些AI翻譯公司所說(shuō)的同傳,和我們從事的同傳,完全就是兩個(gè)事情?!毙說(shuō)。
科大訊飛在此次風(fēng)波過(guò)后的回應(yīng)中提到“人機(jī)耦合”的獨(dú)創(chuàng)概念?!叭藱C(jī)耦合翻譯模式,由機(jī)器提供語(yǔ)音轉(zhuǎn)寫和翻譯結(jié)果給同傳參考,輔助同傳降低工作強(qiáng)度并提升效率,文字展示區(qū)Logo顯示為‘訊飛聽見’。”
但這種服務(wù)同傳譯員的說(shuō)法,看起來(lái)卻基本是一廂情愿。
根據(jù)業(yè)界的定義,同聲傳譯是指譯者用一種語(yǔ)言把另外一種語(yǔ)言所表達(dá)的內(nèi)容,以與發(fā)言人幾乎相同的速度,用口頭形式準(zhǔn)確表達(dá)出來(lái)的一種口譯方式 。
“同傳需要很強(qiáng)的聽力,正確判斷講者的停頓,需要做順句驅(qū)動(dòng),也就是和講者同時(shí)開口并隨時(shí)調(diào)整邏輯確?;就角覝?zhǔn)確?!睆垈ソ榻B。“而機(jī)器現(xiàn)在就只是譯一句喘一兩分鐘,這是假同傳?!?/p>
“同傳已經(jīng)成功運(yùn)行百來(lái)年,不須要這樣的支持。有些翻譯軟件其實(shí)就挺好用,利用人工智能把資料用兩分鐘譯好,關(guān)鍵詞譯的也非常準(zhǔn),這種人工譯員確實(shí)可以利用。”張偉說(shuō)?!暗藱C(jī)耦合就是個(gè)偽命題,因?yàn)橥瑐鞴ぷ髀窂脚c訊飛的工作路徑平行,這怎么耦合?好比兩列齊頭并進(jìn)的火車,同傳譯員邊聽邊譯,人工智能識(shí)別采用的信號(hào)起始點(diǎn)與譯員的起始點(diǎn)一模一樣。你不比我們快,你的車頭不可能站我們前邊拉火車。而站我們后面,我們又不需要你了。”
而且,無(wú)論是科大訊飛還是騰訊的翻譯君,在這幾次會(huì)議同傳中,都沒(méi)有任何輔助人類同傳的行為。
一位曾在博鰲大會(huì)與騰訊翻譯君“一同”為觀眾提供同傳的譯員,曾對(duì)PingWest品玩回憶當(dāng)時(shí)的工作場(chǎng)景:“會(huì)場(chǎng)內(nèi)有一塊屏幕,會(huì)出AI同傳字幕,而人類同傳譯員照例坐在會(huì)議室后面角落的同傳間里,根本看不到。工作時(shí)不可能再分心去關(guān)注它,也更沒(méi)有‘共同工作’的情況。可以比喻成兩套班子同時(shí)工作。我們也是從社交媒體上看到有關(guān)報(bào)道才知道有騰訊的產(chǎn)品在現(xiàn)場(chǎng)的?!?/p>
而在科大訊飛此次的風(fēng)波中,訊飛聽見系統(tǒng)只是把同傳的聲音轉(zhuǎn)為文字,不僅提不上幫助,而且更多是在依賴人類同傳。而且這種語(yǔ)音轉(zhuǎn)字幕功能在同傳場(chǎng)景下更顯的奇怪,炫技的成分多于解決實(shí)際需求的作用。
“現(xiàn)在很多所謂AI同傳在會(huì)場(chǎng)的實(shí)現(xiàn)方式都是打字幕,這樣的設(shè)計(jì)明顯是反人類的,可能更適合聽障人士。因?yàn)槿藗兺ㄟ^(guò)聽力可以獲取更多信息,而且還能邊聽邊把眼睛用在別的地方,比如看看PPT,或者看著本子記筆記等等,用來(lái)看字幕就太奇怪了?!?/p>
“從我的觀察來(lái)看,這些機(jī)器翻譯技術(shù)公司里,應(yīng)該是沒(méi)有哪怕一個(gè)懂同傳的人來(lái)幫他們提供建議。”張偉說(shuō)。
PingWest品玩采訪的多名不同背景的同傳都表示,沒(méi)有聽說(shuō)有翻譯、同傳等專業(yè)背景的人進(jìn)入科技公司參加機(jī)器翻譯研發(fā)的工作,而他們也都沒(méi)有和研究機(jī)器翻譯的人員有過(guò)什么直接交流。
科大訊飛翻譯業(yè)務(wù)的負(fù)責(zé)人翟吉博曾對(duì)PingWest品玩介紹,他們的團(tuán)隊(duì)中也有翻譯出身的人,但具體的職責(zé)僅僅是測(cè)試,對(duì)系統(tǒng)進(jìn)行評(píng)估,制訂些標(biāo)準(zhǔn)。也就是并不會(huì)參加到最核心的討論中。據(jù)PingWest品玩了解,微軟、搜狗等公司情況也類似,翻譯技術(shù)團(tuán)隊(duì)多以機(jī)器學(xué)習(xí)、大數(shù)據(jù)等專業(yè)背景的專家為主,很少有傳統(tǒng)英語(yǔ)學(xué)科背景的人加入。
但事實(shí)上,雙方的這種”絕緣“并非一直如此。
最早在上世紀(jì)70年代,基于規(guī)則的機(jī)器翻譯理論最早被提出,也被稱作傳統(tǒng)的自然語(yǔ)義方法,它屬于最初的AI研究流派之一:“symbolic AI”。這種方法實(shí)現(xiàn)翻譯的方式是,把所有英語(yǔ)和中文語(yǔ)法規(guī)則和一整本英語(yǔ)詞典及一整本中文詞典編碼進(jìn)機(jī)器,之后輸入英語(yǔ)句子后,機(jī)器就對(duì)應(yīng)地得出一句中文。
這其實(shí)是嘗試模仿人類對(duì)語(yǔ)言的理解?!皞鹘y(tǒng)的自然語(yǔ)義方法是按照人類的理解來(lái)理解?!秉S學(xué)東對(duì)PingWest品玩表示。當(dāng)時(shí)最初的機(jī)器翻譯研究者,經(jīng)常需要向語(yǔ)言學(xué)專業(yè)的專家請(qǐng)教,共同研發(fā)。
但之后,到了90年代,基于統(tǒng)計(jì)的方法被應(yīng)用到機(jī)器翻譯領(lǐng)域,并給翻譯效果帶來(lái)巨大的躍升。研發(fā)者也紛紛轉(zhuǎn)向基于統(tǒng)計(jì)的機(jī)器翻譯方法。這種方法更像是純粹的計(jì)算機(jī)方法,已經(jīng)與傳統(tǒng)自然語(yǔ)義方法有很大不同,也不再對(duì)研究翻譯和語(yǔ)言學(xué)等學(xué)科的人們有太多依賴。
而進(jìn)入最近5年,深度學(xué)習(xí)再次推動(dòng)機(jī)器翻譯的進(jìn)步。2011年谷歌開始研發(fā)和使用的“神經(jīng)網(wǎng)絡(luò)”模仿人類大腦由神經(jīng)元構(gòu)成的結(jié)構(gòu),每一層神經(jīng)網(wǎng)絡(luò)都會(huì)對(duì)數(shù)據(jù)進(jìn)行分析以找到其中存在的規(guī)則,多層的神經(jīng)網(wǎng)絡(luò)則類似現(xiàn)在流行的深度學(xué)習(xí)概念,可以發(fā)尋更多的范式。2016年,谷歌將神經(jīng)網(wǎng)絡(luò)用于其翻譯產(chǎn)品上,再次大大提升了翻譯質(zhì)量,逐漸成為現(xiàn)在各家科技公司機(jī)器翻譯技術(shù)的主流。
至此,機(jī)器翻譯的邏輯與人類進(jìn)行翻譯的方法分別走向兩條岔路。
不確定的未來(lái)
“機(jī)器翻譯的算法和人類思維很不同?!秉S學(xué)東說(shuō)。“簡(jiǎn)單形象地描述,機(jī)器翻譯是把一種人類語(yǔ)言投射到一個(gè)數(shù)字化的高維空間,然后在此進(jìn)行解碼,解碼成另外一個(gè)語(yǔ)言。這個(gè)空間高維到人類不可想象?!?/p>
“機(jī)器翻譯和人類翻譯的邏輯很不一樣,其實(shí)對(duì)于我們來(lái)說(shuō),也沒(méi)必要去研究人類同傳或翻譯的邏輯,關(guān)鍵的是算力和數(shù)據(jù)?!币幻趪?guó)內(nèi)科技企業(yè)負(fù)責(zé)機(jī)器翻譯團(tuán)隊(duì)的產(chǎn)品經(jīng)理對(duì)PingWest品玩表示。
黃學(xué)東也表示,提升機(jī)器學(xué)習(xí)的質(zhì)量,要靠高質(zhì)量的數(shù)據(jù)、不同的算法模型以及性能完善的軟件系統(tǒng)。他表示,今年3月微軟的機(jī)器翻譯系統(tǒng)在一個(gè)中-英新聞測(cè)試集上,達(dá)到了可與人工翻譯媲美的水平。此次突破主要依靠的就是機(jī)器學(xué)習(xí)組新研發(fā)的對(duì)偶學(xué)習(xí)、推敲網(wǎng)絡(luò)等模型,其中不少都是受人類工作模式的啟發(fā)。
但是,雖然每個(gè)模型的原理都能說(shuō)清楚,靈感也可能是在模仿人類,然而融合了這些模型的端對(duì)端系統(tǒng)則是一個(gè)超大的神經(jīng)網(wǎng)絡(luò)黑箱。它會(huì)自己把機(jī)器翻譯的模型學(xué)習(xí)出來(lái),外部很難弄清楚里面發(fā)生了什么。這樣的方式也讓機(jī)器翻譯存在著不可解釋性。
在此前博鰲論壇出洋相后,騰訊就對(duì)其中出現(xiàn)亂碼的情況進(jìn)行分析,最終給出的解釋便是:“出現(xiàn)這種情況主要是包括神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在內(nèi)的深度學(xué)習(xí)算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發(fā)翻譯偏差。”
而這些在機(jī)器翻譯研究者眼中已經(jīng)習(xí)慣的“特性”,對(duì)于普通人來(lái)說(shuō)則可能帶來(lái)?yè)?dān)憂。小L就對(duì)機(jī)器翻譯領(lǐng)域大量的晦澀術(shù)語(yǔ)十分反感?!拔覍?duì)機(jī)器翻譯只有很簡(jiǎn)單了解過(guò),我看不懂那些復(fù)雜的算法和技術(shù)?!毙說(shuō)?!暗俏液芊锤羞@些公司在犯錯(cuò)的時(shí)候拿什么不確定性或者其他聽起來(lái)很嚇人的AI高級(jí)術(shù)語(yǔ)來(lái)搪塞。”
小L形容,每每聽到科技公司不斷宣傳“只要數(shù)據(jù)足夠多,就能訓(xùn)練出與人一樣水平的翻譯”時(shí),就好像聽到猴子足夠多就能寫出莎士比亞全集一樣,初聽荒謬可笑,細(xì)想?yún)s感到嚇人:“如果失控了怎么辦?”
除此之外,一些以翻譯為終生事業(yè)的人們還在思考,人類與機(jī)器在對(duì)待語(yǔ)言和翻譯這件事上的不同,會(huì)帶來(lái)什么后果?
人類學(xué)習(xí)外語(yǔ)時(shí),以理解這門語(yǔ)言為目的,但機(jī)器看起來(lái)則僅僅是完成了從輸入到輸出的任務(wù),在不少語(yǔ)言學(xué)者的眼里,它似乎永遠(yuǎn)不能算是“懂得”了一門語(yǔ)言。
“這是個(gè)非常好的問(wèn)題,有各種各樣不同的觀點(diǎn)?!秉S學(xué)東表示,機(jī)器翻譯過(guò)程中,就是從低維空間到高維空間的投射過(guò)程,從計(jì)算機(jī)角度講,它就是理解了這個(gè)語(yǔ)言。反過(guò)來(lái)說(shuō),機(jī)器在高維空間非常得心應(yīng)手,但對(duì)于我們?nèi)祟愑质遣豢衫斫獾?。?/p>
“人類的語(yǔ)言和機(jī)器的語(yǔ)言是不一樣的,而我們現(xiàn)在用了一種機(jī)器可以理解的方案,來(lái)完成人類語(yǔ)言的翻譯,它的效果遠(yuǎn)比基于人類知識(shí)結(jié)構(gòu)方法來(lái)設(shè)計(jì)的機(jī)器翻譯,要好很多。”黃學(xué)東說(shuō)?!斑@就是理想與現(xiàn)實(shí)的差距?!?/p>
其實(shí)我們?nèi)祟愡€不是也一樣,誰(shuí)也說(shuō)不清到底人腦是怎么運(yùn)行,但我們不是一樣在依賴它?那如果有一天我們訓(xùn)練的機(jī)器可以穩(wěn)定輸出,媲美人類,那為什么不能依賴機(jī)器呢?”上述產(chǎn)品經(jīng)理對(duì)PingWest品玩說(shuō)。
就這樣,AI繼續(xù)吃進(jìn)大量的數(shù)據(jù)、補(bǔ)充各種新鮮的模型,從而自我進(jìn)化,然后參加機(jī)器翻譯的比賽,用科技界自己設(shè)立的標(biāo)準(zhǔn)來(lái)衡量著進(jìn)步程度;另一邊,人類同傳則繼續(xù)提升自己對(duì)語(yǔ)言的理解,磨練自己的翻譯技巧,像傳統(tǒng)的手藝人一樣把這種工匠技藝傳承下去。而且,兩者并不怎么溝通。
人類自有文明交流以來(lái)便伴隨出現(xiàn)的語(yǔ)言翻譯這件事,正走入兩個(gè)分岔路。兩者就像在兩個(gè)平行宇宙運(yùn)行,何時(shí)會(huì)重合?還是會(huì)帶來(lái)沖突?
目前沒(méi)人知道。