代碼里的中立刻度
林野的手指懸在回車鍵上,屏幕里的“自由陣線”四個字像顆定時炸彈,讓他後背滲出一層薄汗。
這是101novel.com38年的深秋,星譯科技的算法測試室里永遠飄著速溶咖啡的苦味,三十塊顯示屏晝夜不休地滾動著中英雙語對照文本。作為首席測試工程師,林野今天要過的是最新版“星譯v9”的政治文本翻譯校驗——一份關于中東局勢的聯合國決議草案,光是“武裝組織”“人道主義干預”這類詞匯,就夠算法在中立性的鋼絲上走三回。
“第17段,‘the group has carried out activities’,算法譯成‘該組織實施了恐怖活動’。”林野把鼠標重重砸在桌面上,咖啡杯震出一圈漣漪,“原始文本沒定性,它憑什麼加‘恐怖’倆字?”
身後傳來腳步聲,項目總監陳硯的白襯衫袖口總是熨得筆挺,他湊過來看了眼屏幕,眉頭皺成川字“調取訓練數據日志,看看觸發詞是什麼。”
日志拉到最底,一行紅色代碼跳出來——“關聯地域中東;關聯事件101novel.com37年爆炸案;情感傾向負面”。林野冷笑一聲“就因為這個地區發生過爆炸,所有‘組織’都成恐怖分子了?那要是把地域換成北歐,它是不是得譯成‘該團體開展了相關活動’?”
陳硯沒接話,點開後台的用戶反饋系統。最近三個月,類似投訴堆了三百多條某外媒報道里的“政府改革”,在東南亞用戶端被譯成“政府激進調整”,在北美用戶端卻成了“政府優化舉措”;有佛教用戶反映,“宗教活動場所”被譯成“寺廟”,而伊斯蘭教用戶看到的卻是“清真寺”;更嚴重的是上周,一份聯合國人權報告里的“爭議性政策”,給中東用戶的版本自動加上了“違反人道主義”的後綴。
“再這麼下去,歐盟那邊的倫理審查我們別想過了。”陳硯把反饋表打印出來,紙頁邊緣被他捏得發皺,“董事會昨天發了最後通牒,兩周內必須拿出解決方案,不然星譯v9就別想上線。”
林野盯著屏幕里閃爍的光標,突然想起三年前剛進公司時的場景。那時陳硯還不是總監,兩人擠在同一個工位,通宵改算法漏洞時,陳硯總說“翻譯是橋,不是牆。咱們做ai的,得讓橋兩邊的人看見同一片河,不是你這邊見著浪,他那邊見著沙。”
可現在,這橋明顯歪了。
第二天一上班,林野就把測試組的五個人叫到會議室。剛畢業的實習生甦曉抱著筆記本電腦,小聲說“林哥,我查了算法的地域適配模塊,它會根據用戶ip自動調取當地主流媒體的用詞習慣。比如北美用戶看‘難民’,算法會優先用‘dispced perns’,因為當地媒體更常用這個中性詞,但到了中東,就會自動換成‘refues’,甚至有時會加‘victis’。”
“這不是適配,是偏見。”數據分析師老周推了推眼鏡,調出一份熱力圖,紅色區域集中在中東、東歐和非洲,“你看,這些地區的用戶收到的負面修飾詞,是北美用戶的37倍。算法學的是過去十年的媒體數據,而那些數據本身就帶著報道方的立場,它相當于把別人的偏見嚼碎了,再喂給用戶。”
林野把白板擦得干干淨淨,寫下“語義中立”四個大字“我們得做一套準則,讓算法不管面對什麼內容、什麼用戶,都能守住底線。”
第一個難題就是爭議性詞匯。甦曉試著把“surnt”(叛亂分子)輸入測試版,算法給出三個選項“叛亂分子”“反抗組織”“武裝團體”,但後面跟著的概率值天差地別——“叛亂分子”的匹配度高達89,“武裝團體”只有12。
“不行,概率值不能這麼懸殊。”林野把概率值改成均等的33,“用戶得自己選,而不是算法替他們選。就像你去超市買水,不能因為老板喜歡礦泉水,就把可樂藏在最後一排。”
老周卻搖了搖頭“這麼改,算法的‘流暢度評分’會掉。之前我們做的是‘最優解推薦’,現在改成‘多選項並列’,用戶體驗報告肯定不好看。”
“好看重要還是客觀重要?”林野把筆拍在桌子上,“去年有個留學生,因為算法把‘抗議活動’譯成‘暴亂’,寫論文時被導師質疑立場有問題,差點畢不了業。咱們要是只盯著流暢度,就是在幫算法殺人。”
爭論持續了三天,最終確定了“多版本翻譯”的規則凡是在政治、宗教領域有兩個及以上常見釋義的詞匯,算法必須列出所有選項,並標注每個選項的使用場景(如“適用于中立報道”“多見于官方聲明”),且各選項的展示順序隨機,避免用戶先入為主。
可新的問題又冒了出來。測試時,甦曉用沙特阿拉伯的ip地址輸入“女性權益”,算法雖然給出了三個翻譯選項,但在例句推薦里,自動匹配的都是“該國女性權益正逐步改善”這類偏向正面的句子;換成伊朗的ip,例句就變成了“女性權益仍需進一步提升”。
小主,這個章節後面還有哦,請點擊下一頁繼續後面更精彩!
“地域標簽還在起作用。”林野盯著後台代碼,發現算法里藏著一個“地域情感權重”的隱藏模塊,會根據不同地區的政策傾向,調整例句的情感色彩。他毫不猶豫地把這個模塊刪掉,卻彈出一行警告——“刪除該模塊將導致地域適配性下降,用戶留存率預計降低15”。
“刪。”陳硯不知什麼時候站在了門口,手里拿著一份剛簽好的文件,“我已經跟董事會說了,寧可少賺15的錢,也不能讓星譯變成帶偏見的傳聲筒。”
那天晚上,測試組所有人都留了下來。老周重新訓練了例句庫,把所有帶情感傾向的句子全部篩掉;甦曉設計了“地域盲測”機制,算法在處理文本時,會自動屏蔽用戶的ip地址和地理位置信息;林野則寫了一份《ai翻譯倫理準則》,里面明確寫著“禁止根據用戶地域、信仰調整翻譯傾向;爭議性詞匯需多版本選擇;語義中立優先于翻譯流暢度”。
準則發布前的最後一次測試,林野用了一份最難的文本——關于耶路撒冷歸屬問題的新聞報道。算法沒有再給任何偏向性的翻譯,“聖城”“爭議地區”“歷史名城”三個選項並列展示,例句里既沒有“理應歸屬某國”,也沒有“某國非法佔據”,只有客觀的事實陳述。
“成了。”甦曉興奮地拍著手,屏幕上的中立性評分第一次跳到了100分。
《ai翻譯倫理準則》發布那天,星譯科技上了熱搜。有人在評論區說“終于不用再被算法‘教’著怎麼看世界了”;也有人質疑,沒有地域適配性,翻譯會不會變得生硬。
林野在接受采訪時,舉了個例子“就像兩個人在橋上對話,橋不能幫左邊的人放大聲音,也不能幫右邊的人捂住耳朵。我們要做的,只是把兩邊的話原原本本地傳過去,讓他們自己听,自己判斷。”
那天晚上,林野收到一封郵件,是三年前那個因為算法偏見差點畢不了業的留學生發來的。郵件里說,他現在在一家國際組織做翻譯,看到《ai翻譯倫理準則》時,特意用星譯v9翻譯了一份關于難民問題的報告,“這一次,我終于能給不同國家的同事,看同一份沒有偏見的文本了”。
林野看著郵件,想起陳硯說過的那句話——翻譯是橋,不是牆。而他們這群人,就是在給這座橋刻上中立的刻度,讓每一個走在橋上的人,都能看見同一片河。
窗外的天已經亮了,測試室里的咖啡又續了新的一壺,三十塊顯示屏依舊亮著,只是現在滾動的文本里,再也沒有了那些藏在代碼里的偏見。
喜歡黃浦風雲之杜氏傳奇請大家收藏101novel.com黃浦風雲之杜氏傳奇101novel.com更新速度全網最快。