Ai助力翻译技术发展佩戴技术

使用人工智能(AI)技术的即时翻译功能已开始配备在多种终端上。KDDI开发出了眼镜型终端,中国初创企业开发出了耳机型产品。可以根据用途、交流对象、场景使用不同的终端。在准确性提高到与人工翻译同等水平的情况下,终端的开发也让易用性获得提高,消除语言障碍的未来或将离人们越来越近。

“今天很热,请及时补充水分”,“好的”。9月下旬,在飞岛建设公司承建的兵库县西宫市住宅项目的工地上,日本监督员和越南工人在用自己的母语进行交流。越南语被翻译成日语显示在监督员佩戴于眼部的单眼显示屏上。

让这种对话得以实现的是飞岛建设与日本翻译系统开发公司Rozetta联合开发的AI翻译软件“e-Sense”。该软件内置于单眼显示屏中,可在Wi-Fi环境下使用。

因为是文字显示,即使工地的施工声音很大,也可轻松进行交流。还可以在脚下不稳的建筑工地把双手解放出来。在飞岛建设的工地上,越南工人拿着与软件联动的平板电脑,把日语翻译成越南语显示在屏幕上,通过这种方式进行双向交流。

由于在建筑工地工作的外国人大多是越南人,AI翻译软件除了标配可翻译英文和越南语的功能外,还学习了大量语言数据,因此可增加100种以上的语言。话音落下之后,英语可在1~2秒内,越南语可在3~4秒内翻译成文字显示出来。

还配备了支持建筑业专业术语的翻译引擎。例如,意为独轮手推车的“neko”(日语是猫的意思)翻译成英语不是“cat”,而是“wheelbarrow”。翻译软件登记了超过100条专业术语,可以根据上下文进行准确翻译。

飞岛建设目前在约10个工地使用了单眼显示屏,还计划陆续推广。与外国工人的沟通问题是很多行业共同的课题。飞岛建设新业务开发组课长科部元浩表示,“希望其他建筑企业和造船等不同行业也能使用”。

以前用于翻译的终端主要是以方便为卖点的智能手机APP和SOURCENEXT公司的“POCKETALK”等便携式翻译器。如果终端实现多样化,就能按照不同的用途、交流对象和情况来使用,应用范围将随之扩大。

有望实现自然对话的是耳机型终端。中国初创企业时空壶技术有限公司(Timekettle Technologies)已开始在日本、中国、美国等约10个国家销售可翻译约40种语言的耳机。专用耳机可与手机连接,交谈时将其中一个耳机递给对方来沟通。

由耳机内置的麦克风来捕获说话人的声音,然后由手机APP的AI对其进行翻译,翻译出来的语音会在交谈对象的耳机中即时播放,因此可实现母语之间的对话。手机还可以与耳机无线连接,放在口袋或提包里,不需要盯着屏幕。以往的手机翻译APP需要在交谈对象的面部和屏幕之间交替移动视线,耳机型终端与之不同,可以实现十分自然的对话。还可以使用多个耳机,进行3人以上的交流。

KDDI与中国初创企业太若科技合作开发出了智能眼镜“NrealLight”。通过连接线与安装有翻译APP的手机连接,利用智能眼镜的摄像头拍摄指示牌上的英语和韩语文字时,可以自动进行翻译,显示出日语。

这项功能设想用于观光旅游,可以在东京新宿及涩谷等的4家手机店进行体验。现在,KDDI销售智能眼镜,主要用于观看虚拟现实(VR)视频。如果新冠疫情得以控制,又可以去海外旅游的话,KDDI希望公开翻译APP,让用户可以自由使用翻译功能。

在普及AI翻译方面走在前列的日本SourceNext公司9月在Pocketalk中增加了在“Zoom”和“Teams”等远程会议系统上显示翻译字幕的功能,提高了易用性。如果将专用软件下载到电脑上与之联动,Pocketalk用户可以无偿使用该功能。

智能手机方面,谷歌将于10月28日推出的新机型“Pixel 6”上配备了自动翻译各种直播视频并显示字幕的功能。还可以自动翻译照片内的文字及LINE等软件上的信息。

AI翻译的世界市场今后有望迅速扩大。美国调查公司Global Market Insights预测,2020年的市场规模为6.5亿美元,到2027年将达到30亿美元,是2020年的4.6倍。

AI翻译的准确度大幅提高。特别是在日语和英语的翻译方面远超普通人的水平,提高到了“即使与专业翻译人员相比,准确度也达到95%”(Rozetta的首席执行官渡边麻吕)的水平。

现在的翻译AI为了提高准确度,大多让AI学习数千万~上亿的日语句子与外语句子匹配的数据。这样,AI就可以在对话中自动找出一定的规律,准确翻译多种外文。

目前面临的课题是缩短“等待时间”。现在的很多翻译功能是以句子为单位断句。如果一个句子很长,开始翻译需要等待10秒以上,离同声传译还很遥远。为了克服语言障碍实现自然对话,正在考虑如何缩短等待时间,正在开发新的翻译AI,争取实现更短的断句。

日本信息通信研究机构正在开发根据“语块”断句的翻译技术。到2021年度末,将从同声传译人员等收集断句位置及其译文的数据,2022年度将开发根据句意断句翻译的AI。

这样,开始翻译之前的等待时间有望缩至2~3秒。如果能够实现,语言不同的人们就像母语一样轻松对话的时代就要到来了。