手机看中经经济日报微信中经网微信

张博:搜狗同传“黑科技”助力“数字中国”

2018年04月23日 16:57   来源:经济日报-中国经济网   记者王婉莹

  4月22日-24日,首届数字中国建设峰会在福州举行。随着会议的进行和企业最新成果的发布,记者发现在大屏幕上会不断呈现出发言内容的中英双语字幕,随着发言内容的逐渐完整,屏幕上显示的字幕也会根据语境自动完善。

  据工作人员介绍,在现场担任机器同传工作的“机器人”来自搜狗公司,通过机器同传,嘉宾演讲内容可以实时以中英文字幕显示在屏幕上。它能让参会者无需佩戴同传耳机,而是通过字幕就能直观的接收有效信息。并且“机器人”可以识别方言,降低由于普通话不标准而导致的分享内容的折损,让参会人员最大限度的理解发言内容。

  搜狗AI事业部总经理张博告诉经济日报-中国经济网记者,2011年,搜狗开始研究语音识别技术,至今已有7年,搜狗采取“双引擎”战略,不断加大人工智能技术、产品和服务的研发投入。

  全球首家商用机器同传系统

  据了解,2016年11月,搜狗的机器同传在第三届世界互联网大会“移动互联网论坛”亮相,成为全球首个商用机器同传。

  从首次亮相开始,搜狗同传不断升级。张博表示,在产品化的过程中,为了达到实时的效果,搜狗在速度和精度上做了很多尝试,比如使用了GRU作为搜狗同传的神经元结构,使其可以在性能保持不变的前提下,降低运算复杂度,在层数和参数量上也做了一定的精简。在提升翻译效果方面,针对实体词、集外词、对齐效果的处理上也做了很多研发工作。目前,搜狗同传语音识别的准确率可以达到97%,支持最快400字每分的高速听写,翻译的准确率可以达到90%。方便了参会者更好地理解发布者所讲述的内容。

  先进的神经网络翻译技术

  张博介绍,搜狗还支持语音实时翻译技术SNMT(Sogou Neural Machine Translation),即搜狗同传翻译系统,集成了语音识别、机器翻译、语音合成等先进技术,运行同传翻译时,屏幕上会实时显示出语音识别出的中文或英文,同时也会实时翻译成对应的英文或中文,此外,还可实现男、女声或某特定个人的声音输出翻译后的语言。

  目前,市面上一些机器同传系统在实际操作中会出现大面积单词无意义重复、大小写及字符混乱、中英夹杂翻译混乱、带口音普通话无法识别等现象。“搜狗作为全球首家商用机器同传,两年多的时间里已经积累了无数场同传的实战经验,通过技术创新基本上克服了以上出现的所有问题,为机器同传技术的大规模商用做了有益探索。”张博对经济日报-中国经济网记者表示。 (经济日报-中国经济网记者王婉莹)

(责任编辑:王惠绵)

精彩图片

张博:搜狗同传“黑科技”助力“数字中国”

2018-04-23 16:57 来源:经济日报-中国经济网
查看余下全文