进一步延伸到非洲、印度,谷歌的语音输入技术


来源:

谷歌今天宣布,将扩大其语音识别能力,增加支持数十种新语言,尤其是在印度和非洲新兴市场。

这意味着,世界上有更多的人可以通过谷歌的键盘应用Gboard,使用语音来搜索网络。

该公司表示,更新后,该公司将在全球范围内增加30种语言和地区,使支持语言总数达到119种。

这次更新包括8种印度语言,以及斯瓦希里语和阿姆哈拉语,这两种语言是非洲最大的语言。

新的语音识别技术将首先在Gboard上支持安卓和语音搜索。

与此同时,美国说英语的人现在可以使用语音听写来表达自己使用表情符号的方式。

(例如,你可以只说“眨眼表情”,而不是去找它。)

如今,这种新的语言也在云语音API中获得了支持,该API已经支持了89种语言,并被用于许多第三方语音和视频应用程序,如转录服务、语音分析应用程序、IVR应用程序等。

假以时日,这些新语言将被添加到谷歌的其他产品中,包括谷歌翻译应用。

然而,这条消息的关键部分在于,这对新兴市场的投资者意味着什么——在成为第一批获得技术巨头新技术进步的公司时,这些地区往往被忽视。

但随着移动设备的使用,情况发生了改变。

随着下一大批互联网用户上网,科技公司的目标是在这些地区建立立足点。

尤其是在印度,谷歌扩大语音识别技术的举措可能会产生重大影响。

截至今年6月,印度约有4.2亿移动互联网用户,这使印度成为苹果、谷歌和Facebook等公司在全球最大的市场之一。

谷歌在语音技术领域的扩张也发生在华尔街日报的一篇文章中,详细描述了科技公司如何为发展中国家重新思考他们的产品——特别是,未来10亿手机用户将如何充分利用视频和语音等技术。

例如,谷歌告诉华尔街日报,它看到了“一种新型的互联网用户”——这是一个“与第一批十亿人非常不同”的网络用户。

为了开发这些新语言的语音识别能力,谷歌将人工劳动与机器学习技术结合起来。

该公司表示,它与母语为英语的人合作,通过让他们阅读一些常用短语来收集语音样本。

这反过来又帮助训练了谷歌的机器学习模型,以便更好地理解新语言的发音和词汇,以便随着时间的推移,更多地接触到更多的例子,从而提高它们的准确性。