欢迎来体验
什么是最懂你的中文语音识别算法

华少的快,矮大紧的京范儿口音,神仙打架的《奇葩说》,这些复杂场景的语音识别有多难?今天依图带你领略新鲜出炉的语音识别算法实力。

今天开始,依(zei)图(hao)语音开放平台上线了!

 

业内首次
系统测试主流语音识别厂商的技术性能


(测试完成于2018年11月底)

在全球最大中文普通话数据库AISHELL-2的三个测试子集、Accent近场口音测试集、Chat近场安静聊天测试集上,依图语音识别算法最近测得多项第一。AISHELL-2数据规模达1000小时,是目前全球最大的中文开源数据库。在AISHELL2-2018A-EVAL数据集中,依图语音识别准确率达到96.29%,字错率(CER)为3.71%,领先第二名约17%。

无论是语音助手还是节目,电话客服或是闲聊,依图更懂你。

 

依图语音识别性能优于第二名约17%
语音未来任重道远

通过手机近距离收集声音,依图优于第二名约17%,字字再现强时效内容

语速超快又有地方口音?依图和讯飞挺下来了

考验系统是不是够“皮实”、够“稳健”的时候到了!在远距离场景,环境中会存在噪声、混响和反射,依图和讯飞听见优势明显

从技术性能来说,字错率曲线抖动越小,算法的场景通用性越好。综合各场景测试的结果,业界主流算法中,依图和讯飞的算法字错率抖动相对较小。

但是同样说明了语音识别的发展既有惊喜也有遗憾。各大厂商的近场场景识别能力让我们感受到了科技的力量,而加入远场演讲的高难度场景的识别能力不足,也表明了未来的路还很远。

 

花式挑战算法性能
依图表现稳定

听写大会小程序一经发布,各种评(tiao)测(xi)汹涌而来。依图语音凭借自身优秀的技术,展现了极其稳定的语音识别能力。

再热血的足球解说我们hold住

绕口令?依图能听清!

语音识别歌词,依图可带劲啦!

 

吕昊博士现场演示的这款“听写大会”小程序也是业界第一次基于公开 API 将市场上的主流语音识别技术性能做比较——欢迎大家去花式调戏!


 

 

此次测试的安静对话和混响的数据集,依图也将在线公布,敬请期待!

您可以复制这个链接分享给其他人:https://www.yitutech.com/node/539