近期,国外一份调查报告误将392万和83万的采购费用翻译为39.2亿和830万,闹出国际笑话。有分析认为,此乌龙事件是国外机器翻译软件造成的。
让很多人意想不到的是,看似简单的数字,在机器翻译中向来是一大痛点。就以「392.687694万元」为例,我们测试不同翻译软件的翻译结果。
数字翻译「中译英」测试
首先测试「中译英」,国内外9款主流翻译软件中,只有火山翻译和腾讯翻译君准确地翻译出了392万。其余7款产品,有翻译成392的,有翻译成39.2亿的,甚至还有翻译成392万亿的,比正确结果扩大一亿倍,另外4款都翻译成了3.92亿。测试结果如下列组图所示。
火山翻译:
腾讯翻译君:
《环球时报》发行新闻数字藏品:金色财经报道,据环球时报官方公众号,《环球时报》将于2022年7月12日下午5:20推出重磅新闻数字藏品,并将首次呈现1997年《环球文萃》正式更名为《环球时报》的首刊号,即:1997年1月5日第207期《环球时报》头版数字藏品,本款藏品将作为限量合成款藏品亮相。据悉,此次推出的《环球时报》系列数字藏品共8款,每款10000个,单价5.2元。该系列数字藏品利用数字化技术加工,更有《环球时报》数字报月度免费阅读权限、《环球时报》定制电容笔和记事本等丰富的福利赋能。[2022/7/9 2:02:20]
以下为其他7款翻译产品的测试结果。
翻译为39.2亿:
翻译为392:
英国研究组织:英国央行应该加快推出央行数字货币的步伐:11月28日消息,英国研究组织“积极货币”(Positive Money)表示,英国央行应该加快推出央行数字货币的步伐。该机构的政策和宣传主管西蒙·尤尔说:“在2030年以前,Facebook 等跨国公司可能已经推出了自己的货币,这些货币可能会迅速扩大规模并主导全球货币体系,对问责制、隐私和经济政策制定产生可怕的后果。中央银行应该保持对货币和银行系统进行民主控制的希望,他们应该更快地采取行动引入新的央行数字货币。”[2021/11/28 12:37:02]
翻译为392万亿:
翻译为3.92亿:
Bitfinex于25日启用新数据流传输平台Dazaar 支持数字货币结算:Bitfinex宣布将于6月25日启动新数据流传输平台Dazaar,该平台开源、点对点。Dazaar是p2p开发协议Hypercore的扩展程序,且支持用数字货币买卖数据流。(cryptopotato)[2020/6/24]
数字翻译「英译中」测试
我们用不同软件把英文「3.92687694millionyuan(RMB)」翻译回中文,会是怎么样的结果?
这次只有火山翻译准确翻译出了392万元人民币。其他8款产品,有翻成3.92万的,有翻成39.2亿的,也有翻成392万亿的,另外5家都翻成了3.92万亿。测试结果见下列组图。
火山翻译:
声音 | 上海新金融研究院副院长:数字货币需要现实的检验:12月31日,上海新金融研究院副院长、原浙商银行行长刘晓春做客“金融读书汇”栏目。刘晓春表示,“数字货币”能否成为真正的货币是一个伪命题,因为它要成为真正的货币,不取决于技术,而取决于货币发行制度。目前所有关于数字货币的想象与论说,都是从数字技术角度推论的,并不是现实需求促成的。这与第三方支付完全相反。第三方支付,是因为互联网交易的需求促成的,不是一项特殊的技术引发的。所以,数字货币,还需要现实的检验。(中国网)[2019/12/31]
其他产品的翻译结果:
韩国数字货币交易所计划引入保险机制:韩国区块链协会(KBA)近日透露,计划启动一项仅限会员开放的团体保险计划,由交易所共同为应急基金提供捐款。与此同时,竞争对手韩国区块链产业促进协会(KBIPA)则表示,他们希望与传统的保险公司进行合作,并希望在不久的将来向保险公司做一系列的展示。但一位网络保险专家表示,“数字货币保险在韩国属于早期阶段,由于早期交易发生了很多不好的事情,保险费已经变得非常高,一些保险公司不想去接近交易所,而团体保险政策可能会比个人订购更成问题 ,并且代价高昂。”[2018/4/19]
数字的重要性毋庸多言,在商业条款中如果翻译错一个数字,可能会带来成千上万的损失;建筑图纸中一个数字翻译的疏漏,就可能导致一项庞大建筑工程轰然倒塌。想要保证数字翻译的准确度,远不是誊写一串阿拉伯数字再翻译单位这么简单。从上面测试中也可以看到,一些国际巨头的翻译产品,在数字翻译中照样会出现偏差万倍甚至上亿倍的错误。
数字翻译难在哪?
数字翻译对翻译者关于目标语言数字表达的理解要求较高,在中英翻译中,数字翻译的难点主要在以下方面:
a.中英语言中不同的数字单位,如1000万翻译成10million,不能简单地「拷贝」
b.很长的数字容易带来偏差
c.超大数字的翻译问题,如trillion、万亿以上的单位
d.中英语言中不同的计量单位,如中文中的“斤”,容易被翻译成“kg”
e.带有货币符号的数字容易犯错
当前,很多翻译软件对数字没有做额外的处理,采用的是与普通文字相同的sequence-to-sequence神经机器翻译模型。这一模型翻译质量较高,流畅性较好,但存在一个显著的缺陷,就是缺乏常识和推理能力,无法理解对于人类来说比较简单的规则,例如,“万”和“million”的的转换、单位货币之间的不同等。
火山翻译如何解决数字翻译难题?
我们从火山翻译技术分享中了解到,火山翻译的翻译模型见到对应的数字之后,会将其抽取出来,通过推理、计算等智能过程,对数字进行跨语言的语义转换,然后将其置于翻译句子适当的位置中,类似人类的翻译推理过程。
火山翻译是字节跳动旗下火山引擎的AI中台能力之一,技术能力已经在飞书的文档、消息翻译和火山引擎的企业级客户中广泛应用。由于当前机器翻译场景中存在大量的数字内容,数字翻译也一直是火山翻译团队持续优化的重要方向。目前,火山翻译已经支持56门语言、3080个语向的翻译。
图片来源@视觉中国 日本加密市场逐渐主流化 日本数字货币交易业协会近期数据显示,虽然2013年全球能用加密货币支付的店铺仅有60家,但是时至今日,截止2021年6月.
1900/1/1 0:00:00自2009年开始以来,比特币一直备受争议,随后的加密货币也是如此。Billions项目组虽然比特币因其波动性、在恶意交易中的使用以及过度使用电力来开采而受到广泛批评,但一些人,特别是在发展中国家.
1900/1/1 0:00:00比特币延续前2周涨势,10月以来已涨超过30%。根据CoinDesk数据显示,比特币周一飙破57,000美元,来到今年5月以来最高价格.
1900/1/1 0:00:001、全球博览、博蓝共享、数享易购:这个项目小编连续曝光了多日,现在全国各地都开始预警博蓝共享涉嫌,这个项目现在人人喊打,实际上已经处于跑路状态了,如果早期能够听小编的话.
1900/1/1 0:00:001.智能座舱快速发展,感知、交互成为重点1.1.汽车智能化风起,座舱有望快速发展汽车产品定位渐变,智能化有望加速。汽车行业发展驱动力目前正从供给端产品驱动转向消费者需求驱动.
1900/1/1 0:00:00加密金融正在构筑开放金融新生态DeFi从2020年初7亿美元的总锁仓量一路飙升到了目前的1216.6亿美元,不到一年半的时间,总锁仓量扩大了170多倍,甚至已经超过了德意志银行的资产总量.
1900/1/1 0:00:00