手游巴士(www.shouyoubus.com)2022年02月12日讯:'Pull Request' 是 'Pull Request' 的缩写,它是一个请求审查他人在 GitHub 上的代码的功能。代码通过拉取请求进一步发展。我们每隔一周为IT行业的大小事件提供“拉取请求”,这些事件对了解很有帮助。
网剧《真好》第1季第3集中,李美娜经理被介绍给一名英语流利的新员工。紧接着,在与一位海外客户的电话中,经理立即用谷歌翻译用英文说“ This shipping will be completed in two days ”,回复“This shipping will be completed in two days”。[1] 在这个时代,即使您用韩语对海外住宿留下“诚实的评论”,住宿经营者也可以使用人工智能 ( AI ) 翻译器阅读和删除这些评论。结果,出现了“韩语翻译干扰器”[2],它改变了支持并扭曲了发音,使人工智能翻译无法翻译。因此,尖端的人工智能翻译技术已经深深植根于我们的日常生活中。 事实上,就像“‘Pull Request’是‘Pull Request’的缩写,是在GitHub上一起改进代码的过程”,即使是与
英语不同词序的句子都是“ ‘Pull Request’ 是 缩写对于“拉取请求”,其中 是 在GitHub 上一起改进代码的过程 ” (谷歌)。一些人工智能翻译器甚至将新创造的单词“dangdangi”和“dingjak”翻译成韩文中形状相似的不同字母,如“小狗”和“杰作”等。
△这是一个人工智能甚至可以翻译当当和叮当的时代。
人工智能技术在“机器 翻译”领域的使用相对较新,这是一种使用计算机翻译人类语言的技术。直到1990 年代后期,“ RMT,基于规则的机器翻译”( RMT )技术,即试图通过系统地研究每种语言的语法,并通过人类寻找规律性来创建翻译程序。随着2000 年代初至中期“统计机器翻译”(SMT)技术的出现,游戏规则发生了变化。由于翻译程序基于人类翻译的数百或数十亿句子的统计分析表现良好,“大数据”的重要性自然而然地出现在机器翻译领域。多亏了这一点,“基于人工神经网络的翻译”(NMT,Neural 机器 翻译) 方法,从大数据中学习适合每种语言的表达并使用它的AI翻译技术已经问世。 [3]
那么,截至2022 年,哪些句子没有被AI很好地翻译?例如,想象一个场景,您和您的朋友在中餐馆点外卖。“你要我做什么?我用酱油减肥。” “那我是Jjamppong吗?” 两人的对话只有三句话,包括标点和空格在内的30个字。(注意双引号与ASCII码34 "字符一起使用。)把这段对话翻译成英文会是什么结果?下面是随机选择的8个流行的互联网翻译的结果。
△ 八位翻译给出了自己的答案。
百度、Systran和Flitto任意更改了标点符号和空格。Flitto 以一种很酷的方式省略了“Ganjajang”,而Papago将“Ganjajang”移至“Jjajangmyeon”。Kakao i 和微软的 Bing完全变成了“ dick”、“ ganja- clasp”和“ hookup ”等不明词。Google、Kakao I、Bing、Watson 和 Systran 都将“选择菜单”翻译成“自我介绍”。最后,谷歌将“乘法”的“减法”解释为“减肥”,即“减肥 ”。虽然翻译结果似乎符合英语语法,但意思却完全不同。
很难分析为什么每个译者都这样翻译。特别是在转向NMT方法后,分析错误的原因或改进错误变得更加困难。例如,SMT在 . 例如,曾有美国总统改名伊拉克总统的案例。据统计,这是因为两个人的名字经常出现在同一个句子中。尽管如此,在SMT中,找出错误的原因并改进它们相对容易,因为由几个短词组成的“一个词”或“短语”被翻译为标准。
然而,在NMT中,不仅数据量是一个问题,而且单词的列出顺序和上下文都被复杂地考虑,使得查找问题的原因变得更加困难。特别是在翻译中,释义的情况很多,很容易发现误译的原因不仅仅是某个特定的词。对于自然翻译,可以省略一个或两个单词或整个短语,或者可以插入原文中没有的chuimsae。即使是具有相同表达或相同结构的句子,在AI学习中也可以被完全不同的感知。
甚至最近的一项研究也发现,当大小写或特殊字符的细微差异被视为“其他”时,翻译质量会更高。因此,一些AI翻译人员即使只更改大小写或特殊字符,也会显着改变翻译结果。例句中,如果改变champon和ganjajang的顺序,或者把引号从“改为”,(ASCII码8220,0221 ) ,可以看到翻译结果发生了明显的变化。甚至从德语到韩语的时候翻译,有些情况下,将某人的电子邮件地址误解为特定人员的电子邮件地址的错误,无论它是否写在原始文本中,都没有得到修复很长一段时间 [ 12 ]
△" 或“, ”...根据插入的引号,译者的答案可能会有所不同。
如果有更多的学习数据供AI研究,这些问题能否得到解决?有些问题很难靠自己解决。与性别有关的问题就是一个典型的例子。韩语相对容易写,句子结构不透露主语的性别,但有很多语言不透露,包括英语。“他是教授。这就是为什么很难找到一个能正确翻译“她是护士”的人工智能。由于表达方法本身在语言中没有得到很好的使用,人工智能将拟合原始文本中没有的“性别”信息,以使用它一直在学习的语言的“自然”句子。在这个过程中,有些词被移到“女”,或者在没有性别信息的情况下,被无条件地移到“男”。
△ 没有透露对象的性别,但翻译成英文时,被翻译成固定的性别。
到目前为止,我们已经了解了AI翻译的各种错误和基本限制。虽然人工智能很方便,并且已经深入到我们的生活中,但我们应该知道,我们随时都可能犯错。直到两年前,韩语中的“三天”和“四天”都被翻译成了“四天 ”,这不是一个热门话题吗?[ 15 ] 好消息是,专家们正在积极提出观点和研究,以认识和改善这些局限性。[ 16 ] [ 17 ] 使“可解释人工智能”(eXplainable AI )技术成为现实的努力仍在继续,而不仅仅是解释说深度学习是一个黑匣子,原因不明。因此,在不远的将来,我们或许可以期待一种能够提供比我们今天看到的更令人满意的翻译的人工智能。
以上就是手游巴士为您提供《【Pullique 一起分享】“你想吃什么?我用AI翻译的》的详细内容,更多精彩内容请继续阅读上一篇《
ARM又开卖了,三星电子能买到吗》