Mozilla使用开源Common Voice语音识别数据集进行多语言操作
2018-06-08 08:02:41
Mozilla宣布它正在扩大其众包的Common Voice项目 - 一项旨在创建开源语音识别数据集的举措 - 包括更多语言。
该技术组织于去年6月首次发布Common Voice,邀请来自世界各地的志愿者通过网络和移动应用程序,用他们的声音记录文本片段 。

上图:记录你的声音

该项目与亚马逊,谷歌,苹果和微软等正在开发的专有语音识别技术的不断增长的军火库相反。上述巨头正在大力投资于语音激活数字助理Alexa,谷歌助理,Siri和Cortana,但各自的数据集均由公司自己拥有。
Mozilla 于11月推出了英语Common Voice数据集的第一批成果,收录了大约500小时的演讲,并从20000个人中构建了40万个录音。今天,Mozilla 正式开始收集另外三种语言的语音数据 - 法语,德语和 - 随机 - 威尔士语 - 的过程。目前正在为数据收集过程准备另外40种语言,巴西葡萄牙语,中国(台湾),印度尼西亚语,波兰语和荷兰语等国家已经准备好启动众包语音数据。
下一个大平台
多年来,语音将成为技术的下一个重要平台。就在昨天,亚马逊正式推出了新款相机注入,Alexa供电的Echo Look智能扬声器,告诉你应该穿什么样的衣服。我们仍然处于这场运动的早期阶段,但显然声音只会变得更加普遍。
正是在这种背景下,Mozilla正在推进创建开源数据集的计划,任何人都可以自由使用这些数据集来将语音识别智能构建到各种应用程序和服务中。
Mozilla首席创新官Katharina Borchert表示:“我们相信这些接口不应该由少数几家公司作为守门员来控制语音服务,并且我们希望用户能够以他们自己的语言和口音持续理解用户,”Mozilla首席创新官Katharina Borchert说。博客帖子。
Common Voice项目的用途类似于其他用于打击私人平台的开放许可证项目。OpenStreetMap 是类似众包项目的一个很好的例子,该项目为开发人员提供开放且可自由使用的世界地图,而无需谷歌地图等竞争对手服务的成本或限制。
在可访问性方面,英语可能在很多方面成为互联网的通用语,但事实是大多数人会说英语以外的语言作为他们的母语。随着语音识别AI革命的兴起,为开发机器学习模型提供开发人员和技术人员多语言数据集的任何事情都只能是一件好事。
“使用多种语言标志着Common Voice迈出了重要的一步,我们希望这对于整体语音技术来说也是一大步,” Mozilla Common Voice项目的数字策略师Michael Henretty 补充道。“语音技术的民主化不仅会降低全球创新的障碍,而且也是获取信息的障碍。”
