发布日期:2026-03-25 19:41 点击次数:95


最近AI自媒体启动奋勇研究多样英文工夫名词的汉文新译法。Token的新译法纷纷清晰:灵符、模元、信符、说念元、智筹、智元、智根、偷啃……
“茴字有几种写法”确现代举止版块,从未像当今这么期望盎然且不(太)招东说念主嫌。推敲AI、token和prompt该若何译,真的给业界带来一阵中国温度。
将token译为“偷啃”、将AI译为“硅头”,天然不太适当。但当今巨匠的咬文嚼字关怀,也不是特殊必要。独知名词的翻译与流行有自生的规矩,硬钻牛角尖忙碌不市欢。
毕竟“中国日均词元调用量冲破140万亿”报说念,还是将token和“词元”的译法标定。自媒体再有东说念主气,大不外这种认证。
01
按唐僧的次序,径直音译对汉文无害
当今巨匠都知说念严复的“译事三难”原则是外文译汉文的基础原则,不外“信、达、雅”虽然自己是外文中译的黄金次序和典范示例,但不是独一的次序。汉文不是从百多年前才启动有翻译。
玄奘法师算作翻译界祖师之一,给过“五不翻”的准则,在五种情况下,不错分裂外文中的专属名词进行意译,用音译也行:
“好意思妙”,有好意思妙性质的术语;
“含多义”,多义词;
“此无”,汉文里的确找不到有涓滴附进的近义词;
“顺古”,还是通行的音译,荀子讲过“沿袭成习谓之宜,异于约则谓之不宜”;
“生善”,有宣扬译者重视的不雅念的需要。

以这“五不翻”,就能看出AI磋磨字眼若是没法意译,径直音译也无碍。拿天怒东说念主怨、神泣鬼号、最出名的工夫名词翻译“鲁棒性”来说吧,这个音译词乍看碍眼、细推敲却适合“五不翻”原则。
当今巨匠都知说念“鲁棒”是径直音译“robust”。可验证的起源,是1979年南开大学涂奉生、皆寅峰老师发表的论文《鲁棒(Robust)转化器》和《鲁棒转化器的一种瞎想》。
在此之前,要把“robust”在多样工程学科中“系统在外部压力、不确信条目、环境特质参数变化下守护原有性能景象”的含义翻译出,“宽厚性”和“稳健性”的译法都用过,但都不透顶传达含义。“鲁棒”一出,业内都以为这说法的字义最贴合。
1980年的专科东说念主士评价是:“鲁棒有山东大棒之意,倒是音义兼顾”;
“‘音义兼顾’的绝好译法。因为‘robust转化器’具有‘使系统保捏融会且具有渐进转化特质的才调’,而‘鲁’者冒失也,‘棒’者强之同义也。是以‘鲁棒’一词较好地标明了此类转化器的特征,且较‘粗壮’,‘结实’等词纯真”。
看,“鲁棒”适合了“含多义”、“顺古”的音译原则。
说回AI限度,巨匠在推敲完Token和Prompt该若何意译之前,是否该念念念念若是要意译每个英文AI字眼,SOTA该不该排位更先?毕竟一个State of the art的缩写词非要写英笔墨眼、且按英文拼音法连读,而非径直意译成“业内前沿”,的确岂有此理。
天然,不译SOTA也适合“五不翻”原则里的“好意思妙”、“顺古”和“生善”。用现代粗话说,等于巨匠习惯了,况兼这字眼显得使用者懂行、看不懂的东说念主生手,体现逼格和门槛,你硬碰巨匠还是酿成的语言习惯干嘛。
02
若庄重“传信”且“知晓”,Token等于“词元”
“信达雅”三原则,在翻译中必有遴选:“信”为根蒂,但弗成执拗;在保证“达”的前提下,“信”不错适合调解;“雅”等于烤串上的孜然,有天然很好,莫得也过得去。从孔子启动,“文勿胜质”、“勿以辞害意”等于说汉文的次序。
Token译成“词元”,不仅“顺古”,豪门国际娱乐况兼在“信”、“达”、“雅”三成分中至少占了两个,真没必要持续推敲了。
“顺古”,是因为《策画机科学工夫名词(第三版)》里,已将AI天然语言解决/策画语言学场景下的Token轨范译为“词元”;顶级会论说文集和专科刊物论文的汉文译稿、中国高校的策画语言学专科课本,也大宗采取“词元”译法。你要改,你先跟“中国科学工夫名词核定委员会”和异邦的会议举办方去杠。
况兼Token译成“词元”,在“信”的准确性要求、和“达”的晓畅显明要求之间,有最合适的平衡。在byte顶了“字节”的“字”之后,“词”和“元”的组合词,等于最切现状兼最易融会的“最基础、不可再分的基本策画单位”表述。
挑战“词元”译法的立论,大宗在“Token弗成严格对应单个字/词”的工夫性质上立基。
是啊是啊,耗千个token生成的是750个傍边英语单词、大模子答分裂“strawberry里有几个r”和“9.11与9.9谁更大”是因为token的分隔旨趣和天然东说念主语言不同样,你知说念我知说念巨匠都知说念。但揪着这些工夫细节,去改还是通用的译名,显你念书多、能耐大吗?
硬要追求译词指代的涵义既全面又精确,那Token用区块链期间的“代币”译法也比新造好。
毕竟从黄仁勋到腾讯、阿里,大厂和大雇主们当今都说token耗尽量与分娩效率挂钩、要把token配比薪资发给职工。管Token叫“代币”,这下又没纰谬了。拿南京方言口音念,还有一点谐谑的恶兴味,“雅”这块也顾及。
03
译词越短越好,Prompt只会成为“教导”
中译工夫专属名词,音译敌不外意译、最终被意译取代的例子不少,大宗适合两个条目:一是音译的确太不知所谓,二是意译比音译短、且有最短的选项。
音译让东说念主不晓得在说啥的典范,等于严复本东说念主。大清国的赐进士老爷既要翻译英文书,又歧视其时径直搬运“和式汉语”字眼的“东学”民风,就只须用音译来完成独知名词的英译中任务。
“幺匿”、“拓都”、“涅伏”,严复创始的这些音译看上去比“鲁棒”不知所谓得多。别说当今,近百年前的学问分子一眼也猜不透这是在说啥,不读他的译作,谁也不知说念这是在翻译“unit”、“total”、“nerve”。其时大东说念主物的翻译被收入入学检修之后,径直让将来大东说念主物郭沫若哭爹叫娘:“我的妈!这么伟大的一个穷苦,的确足以把东说念主难倒。”
当“幺匿”、“拓都”、“涅伏”被汉文使用者烧毁,“nerve”的汉文对应词莫得奉赵到谭嗣同和洋教士版块的“脑气筋”,“unit”、“total”、“nerve”译词使用了日本东说念主的“个体”、“总体”、“神经”。原因不用解说,三个字的单词遥远莫得两个字的单词更受接待。
若是径直音译更准确但更拗口,汉文使用者会很开明地使用真谛不那么准确、而字面更纯粹的意译。比如“伯里玺天德”是清国翻译的精确表述:“权利效率比皇上强、但礼节尊贵不如皇上的头号大官”,“总统”是日本东说念主译法“大管辖”的缩写。“伯里玺天德”缩成“总统”,真谛上不够准确,但后者连忙流行。
哪种译法在相比保真的前提下更短,普罗巨匠就会选拔哪种。“西敏寺”比“威斯敏斯特”好用,是因为既传递“Westminster这地点是古伦敦西界之外更西”的真谛,又更简陋。“拍立得”、“肯德基”,更是典范。当今最钻牛角尖的中国东说念主也不会用“即时成像相机”、“肯塔基州炸鸡”来说这两种商品。
这条原则愚弄在AI业界,等于Prompt即使不被译成“教导词”,也不可能译成其他花里胡梢、附属细密的硬拗,只会被缩写成“教导”或“提词”。这种语言风光正在发生,在阿里云的官方网站上就有出现。

当今“生成-回击收罗”这个AI倡导不流行了,否则还会给这种语言风光添上更兴味的注解:看巨匠是会使用“生成-回击收罗”这个词,照旧径直把英文缩写GAN拿汉文拼音法读出来。
毕竟当今网店商家拿AI生成的假图当成门面像片、商品实拍,网购顾主拿AI生成的假图当退款把柄,已成巨匠新潮水。这种真东说念主们互相作念“生成器-判别器”回击的糊口豪门国际娱乐,真的是很GAN啊。
易游官方网站APP下载