央广网合肥12月18日消息(通讯员张沛、刘辉)12月18日下午,合肥师范学院一间特殊的考场内,“考生”是科大讯飞一套机器翻译系统。 考题来自三天前结束的大学英语六级考试,评分的是两位具有六级阅卷经验的高校资深专家,“这套机器翻译系统的表现让我们惊喜,翻译得很地道。”对于成绩,她们的鉴定是:优秀! 看似普通的系统背后,是机器翻译领域近一个世纪的技术积累,也包含着科大讯飞创新实现的领域翻译技术突破以及最新推出的行业翻译解决方案。 12月18日,合肥师范学院一教室内,试题输入人员在公证人员的见证下现场给科大讯飞机器翻译系统录入试题。 在六级翻译测试中,共有三道考题。按规定,考生们只需作答一题,时间是半小时。 词汇量是第一需要具备的,目前六级词汇量要求达到6000个,不乏生僻词汇和短语;由于汉英间表达习惯的不同,逻辑、语序调整也十分重要。 “经过三百年的发展,唐代中国变成全球上最繁荣的强国,其首都长安是世界上最大的都市,这一时期,经济发达,商业繁荣,社会秩序稳定,甚至边境也对外开放,随着城市化的财富的增加,艺术和文学也繁荣起来。” 每次通过率只有30%左右,也足以说明六级考试的不易。但科大讯飞还是决定要挑战。 为确保在断网和无人工干预的情况下测评,科大讯飞的团队12月14日就将机器和系统封存在公证处。12月18日,在公证人员的见证下,考官分别打开三道考题,由人工输入电脑后系统作答,不到5秒便导出了文本。 成绩令人惊喜:每道题取三位评分专家的平均分,再计算三道题的平均分,最终机器翻译系统拿下13分。参考往年大学英语六级翻译考题的表现,可达到优秀六级考生的水平。 12月18日,合肥师范学院一教室内,试题输入人员在公证人员的见证下现场给科大讯飞机器翻译系统录入试题。 现场两位评分专家来自上海交通大学外语学院,“这套系统翻译出来的语言质量很高、语法也很地道,表现好过我们得预期让我们惊喜。” 她们给出的评价称:机器翻译能准确表达原文意思、译文流畅、结构清晰,可以较好的辅助不同语言的信息沟通。 据悉,在参加此次评测前,科大讯飞研发人员在2014年6月到2018年6月的大学英语六级26道翻译考题上进行了测试,平均分达到12.8分,与此次测试结果基本持平,“这也说明机器翻译可以稳定在高水平。” 随着以深度学习为代表的第三次人工智能技术的发展,机器翻译取得了长足的进步,在简单应用场景下跨过了应用门槛。 “但到目前为止,机器翻译到底达到了什么样的水平,还没有人能够给出明确答案。” 大学英语六级考试正是一种权威客观的衡量方式,“借助于六级中的翻译考题,我们想客观公正地给出当前以汉译英为例的机器翻译技术水平的评估,包括还存在哪些差距。”这样一方面为后续研究提供思路,另方面也可进一步指导机器翻译技术应用。 据了解,科大讯飞自2012年启动机器翻译的研发工作,目前已取得不俗的成绩,很多技术也达到世界领先水平。 2014年,在IWSLT口译翻译比赛上就取得了中英互译的第一名;2015年在NIST国际openMT机器翻译比赛,中英人工主观分获得冠军;刚刚过去的2018年IWSLT比赛,在端到端的语音翻译上再次以显著优势取得第一名的成绩。 但机器翻译还是很难,“主要是其处理的对象——自然语言存在复杂性。”研发人员介绍,自然语言是人类在社会生活中,通过不断的重复性使用而自然进化形成的沟通媒介(语言),并且在此过程中缺少规划和设计,使得语言本身就存在诸多不确定性,“同样一句话,在不同的语境中不同人就有不同的理解。” “一是核心算法,二是大规模语料库,三是高性能计算平台。”研究人员介绍,机器翻译技术是利用计算机把一种自然语言翻译成另一种自然语言,从1933年正式被提出开始,目前已发展有三代技术、取得了长足的进步。 “最新一代技术是基于端到端的神经机器翻译。”神经机器翻译算法的提出,是当前机器翻译取得重大突破的关键。 大规模平行语料的积累则是基础。目前对于汉语和英语等大语种,业界积累的类似汉语和英语对齐的翻译句对已达到千万甚至数亿级别,这成为机器翻译学习的语料。 面对数亿级的模型参数和训练数据,以图形处理器为代表的高性能计算硬件的提出和发展,也必不可少。 这些得益于行业内机器翻译技术的整体发展;但想拿到高分,少不了“独门秘笈”。 “六级翻译题涉及文化、经济、历史、社会等多领域,还有不少专业表达或中国特色词汇,在整个翻译系统可供训练的语料中是比较匮乏的。”科大讯飞为了破解这一难题,对神经机器翻译进行若干改进,其中一项重要改进是领域翻译技术,即在通用翻译模型之上进行了领域定制。 其中一项技术是领域个性化。“传统翻译模型一般针对具体应用场景搜集该领域相关语料,但在实际应用中,由于‘精力不够’会导致其他领域的翻译效果受影响。”这就好比学习中的“偏科”,进而影响了总分。为此,科大讯飞研发人员在保持原有翻译系统不变的基础上、引入额外的旁支模型,“可最大限度实现目标领域和其他领域翻译性能的兼顾。” 方案内的另一项技术是术语词典拼接融合。“翻译中常会遇到行业术语,有的机器可能没见过、有的见过却在不一样的行业有不同翻译方式。”科大讯飞给出的解决方案是:提前将行业领域的关键词汇融入翻译模型,指导机器在平日训练中自动学习术语,从而在翻译过程中产生正确的译文。 基于机器翻译技术的不断突破及创新方案的提出,“身怀绝技”的机器翻译系统,也得以在应用领域内“大显身手”。 早在2016年,科大讯飞发布讯飞翻译机产品,并在业界第一个推出了纯离线的神经网络的离线口语翻译系统。而今,讯飞翻译机的用户遍及全球170个国家。刚刚过去的双十一,在翻译机品类中,讯飞翻译机占据了70%的销售份额,远远领先市面上其他的同类产品。 在某跨国医疗技术峰会现场,你可以拿出最新升级的讯飞翻译机2.0,和与会外宾专家畅聊。从“口袋里的翻译官”升级为“行业翻译官”,这台小机器在通用翻译模式下新增行业翻译模式,正是使用了该技术;除了金融,在医疗、计算机等行业专业场景下都能轻松实现中文与英文的及时互译。 环保论坛会前,你也不必忙着为听见智能会议系统定制领域术语,或者在会上为翻译效果提心吊胆;有了最新的机器翻译技术,不仅领域和行业术语定制的又准又好,整体的翻译效果也不会打折扣。 即便你是职场新人,当上司给你布置了厚厚一叠出口产品说明书的翻译时,你也不必挑灯夜战了。因为最新的机器翻译技术能辅助笔译,“可让机器先翻译一遍、人工再精修。” 让人类更便捷的交流、更轻松的工作,机器翻译技术的发展也正在是实现着用人工智能建设美好世界的愿景。 值得说明的是,尽管机器翻译技术已取得大幅进步,在语料丰富的语言和用户相对配合的使用环境下达到可用性门槛,但由于语言本身的复杂性,机器翻译还有非常长的路要走。”对翻译技术的研究是为了更好地辅助人类进行语言沟通,帮助普通人达到一定的外语水平;但也需要人工来帮助机器完成无法处理的问题、更好的解决自身局限,“专业翻译人员在翻译过程中积累的语料和知识,反过来也能促进机器进化。”这是人机协同的逻辑。 技术的发展并不是要取代人工,而是要让人站在人工智能的肩膀上去做更有意义的事。科大讯飞相信:未来比人类更强大的不是A.I.,而是掌控了A.I.的人类。 人工智能是二十一世纪三大尖端技术之一,为了让合肥市民近距离感受AI和智能语音前沿“黑科技”的魅力,11月16日-11月18日安徽合肥万象城一楼中庭,科大讯飞搭建起“语音”为主题的声音实验室,讯飞“黑科技”组团亮相,营造语音科技与真实的生活相融合的氛围,明星产品也吸引了大众好奇的目光。 2018年10月24日,世界的目光将聚焦到江淮大地这片沃土之上——2018首届世界声博会暨科大讯飞第二届全球1024开发者节将在安徽合肥盛大开幕。作为国内语音产业的龙头老大和世界AI产业的强者,科大讯飞将带来智能穿戴、身份认证、智能识别等领先A.I.科技,让世界聆听到中国声音。 新闻热线:法务部邮箱:中央人民广播电台节目覆盖情况反映热线: 12月18日下午,合肥师范学院一间特殊的考场内,“考生”是科大讯飞一套机器翻译系统。