谷歌研究人员训练AI来区分9种印度语言

2019-10-09 16:21:20　来源：新媒体传播网

世界上讲数千种语言，准确地说大约是6,500种语言，而Google，Facebook，Apple和Amazon等系统每天都在更好地识别它们。问题是，并非所有这些语言都具有大量可用的语料库，这会使训练支撑这些系统的数据量巨大的模型变得困难。

这就是Google研究人员正在探索将知识从数据丰富的语言应用于数据稀缺的语言的技术的原因。它以多语言语音解析器的形式取得了成果，该解析器学习了多种语言的转录，最近在2019年奥地利Interspeech会议上接受的预印本中对此进行了详细说明。合著者说，他们的单一端到端模型可以高度准确地识别九种印度语言(印地语，马拉地语，乌尔都语，孟加拉语，泰米尔语，泰卢固语，卡纳达语，马拉雅拉姆语和古吉拉特语)，同时证明了“戏剧性”的改进自动语音识别(ASR)的质量。

“在这项研究中，我们关注的是印度，这是一个固有的多语言社会，那里有三十多种语言，至少有一百万人以英语为母语。由于母语的地理位置和共同的文化历史，这些语言中的许多语言在声学和词汇上都有重叠。”主要合著者以及Google Research软件工程师Arindrima Datta和Anjuli Kannan在博客中解释道。“此外，许多印度人是双语或三语的，这使得在对话中使用多种语言成为一种普遍现象，并且是训练单一多语言模型的自然案例。”

在某种程度上，研究人员的系统体系结构将声学，发音和语言成分结合在一起。先前的多语言ASR工作无法解决实时语音识别的问题。相比之下，由Datta，Kannan及其同事提出的模型利用了递归神经网络传感器，该传感器适于一次输出一个字符的多种语言的单词。

为了减轻因转录的语言的小数据集而引起的偏见，研究人员修改了系统架构，以包括额外的语言标识符输入，即从训练数据的语言区域派生的外部信号。(一个示例：在智能手机中设置的语言首选项。)与音频输入相结合，它使模型可以消除给定语言的歧义，并根据需要学习不同语言的单独功能。

该团队通过以剩余适配器模块的形式为每种语言分配其他参数，进一步扩展了模型，从而有助于微调全局每种语言模型并提高整体性能。最终结果是一种多语言系统，其性能优于所有其他单语言识别器，并简化了培训和服务，同时满足了Google Assistant等应用程序的延迟要求。

共同作者写道：“基于这一结果，我们希望继续针对其他语言群体的多语言ASR进行研究，以更好地帮助我们不断增长的多样化用户群体。” “ Google的使命不仅是组织世界各地的信息，而且使世界各地的人们都可以访问它，这意味着确保我们的产品能够以世界上尽可能多的语言工作。”

该系统-或类似的系统-可能会进入Google Assistant，该系统在2月份获得了对多韩语，北印度语，瑞典语，挪威语，丹麦语和荷兰语的多圈对话的多语言支持。在相关新闻中，Google推出了解释器模式，可翻译数十种语言和九种由AI生成的新声音。

郑重声明:本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

热点推荐

· 看看在黑暗中发光的三菱Evo汽车
Dip Your Car进行了一项实验，将三菱Evo转变为夜光汽车，其结果发布在同名的YouTube频道上。事实证明，将荧光漆涂在具有光亮层的身体上并
· Memoji现在可以在最新的苹果iOS 1...
我认为这是我们只能与Emojis聊天的时候了，您的朋友仍然会理解您要说的话。如今，随着疯狂的表情符号数量的增加，您可以从表情符号选项卡中
· 联想使用高通Snapdragon 865制造...
根据在weibo com上发布的图像，看来联想可能会推出自己的游戏智能手机，该智能手机将配备高通公司的顶级Snapdragon 865芯片组。此外，发布
· 新消息确认荣耀X50Pro5G智能手机的...
昨天，realme宣布将在线发布 realme X50 Pro 5G。但很明显，该公司无意放弃这种戏弄，最新消息证实该智能手机的显示屏将具有90Hz的刷新
· 在2020年亚马逊Prime Day期间可获...
亚马逊2020年Prime Day为各种耳机带来了很多优惠，包括索尼的新型WH-1000XM4无线耳挂式耳机，该耳机具有市场上最好的噪音消除功能。这套特
· 索尼最好的降噪耳机在Prime Day上...
如果您从Verge链接购买商品，Vox Media可能会赚取佣金。请参阅我们的道德声明。2020年黄金日的第二天也是最后一天，但接下来的几个小时仍
· Spotify现在拥有自己的iOS 14小部件
自iOS 14发布以来的几周内，越来越多的应用程序在增加新功能，以利用Apple最新更新中的功能。现在，Spotify也加入了。今天，领先的订阅音
· 苹果TV应用程序出现在Sony的一些最...
如果您从Verge链接购买商品，Vox Media可能会赚取佣金。请参阅我们的道德声明。苹果的Apple TV应用程序首次进入了Android TV。索尼宣布
· 宏G支持G-Sync的27英寸4K 144Hz游...
如果您从Verge链接购买商品，Vox Media可能会赚取佣金。请参阅我们的道德声明。宏A在亚马逊上的27英寸4K Predator游戏显示器的闪电交易持
· 谷歌Glass正在添加Meet 以便远程...
您可能已经有一段时间没有考虑过Google Glass了，但其抬头显示器的企业版却有了一个巧妙的新技巧：它将能够使用Google Meet(以前称为Hang
· 贝尔金的首批MagSafe产品是外观精...
苹果公司新的MagSafe配件生态系统还没有建立一天，但是Belkin已经开始使用新的使用磁性充电系统的充电配件，并推出了新的BoostCharge Pro
· 谷歌的新手势系统将可用于所有Pixel设备
除了触摸屏幕或按下按钮外，我们还有许多其他方式可以与智能手机进行交互。借助最新的Google Pixel 4 系列的Motion Sense ，我们可以
· 华为于2020年推出其6nm麒麟820 5G芯片
华为最近宣布，他们可能会推出新的麒麟820 5G芯片组，该芯片组将在2020年2月24日晚上9点举行的在线会议上揭晓。根据gizchina com的声明，
· 华为将开发一款具有多达8个摄像头...
最近花姐发现有诸多的小伙伴们对于华为将开发一款具有多达8个摄像头传感器的智能手机吗这个问题都颇为感兴趣的，大家也都想要及时了解到华
· 配备64MP AI Quad相机的荣耀6系...
realme在其官方网站上发布了一张图片，其中提到realme 6系列(包括realme 6以及Pro变体)将于2020年3月5日发布。虽然关于上述智能手机的完
· 未来的智能手机会使用用户可更换的...
根据fd nl上的一份报告，看来欧盟正在制定一项提案，要求智能手机具有用户可更换的电池。这是由于以下事实：用户通常将旧的智能手机换成较
· FlyPods 3是HONOR为您呈现的全新...
除了HONOR View 30 Pro 和HONOR 9X Pro，HONOR在巴塞罗那举行的发布会上也给我们带来了另一个惊喜。该公司已经宣布了名为HONOR FlyP
· LG推出V60 ThinQ 5G智能手机和改...
大约两周前，我们得到了LG即将推出的旗舰智能手机的渲染图，暗示了其内部外观。好吧，渲染似乎很准确。LG正式发布了V60 ThinkQ 5G，已
· 据说苹果的2020年WWDC将举行传闻...
由于使用了COVID-19病毒，该疾病已成功地减慢了速度，并取消了大多数事件。最近的一次是2020年世界移动通信大会，也有谣言说东京奥运会也将
· 三星为下一代智能手机推出12GB LPDDR4X DRAM
三星宣布将发布其用于下一代智能手机的新型12GB LPDDR4X DRAM，该芯片旨在用于未来的手机。我们可以预计，今年新的12GB LPDDR4X DRAM将

新媒体传播网

谷歌研究人员训练AI来区分9种印度语言

相关文章

热点推荐

点击排行