Facebook ReBel通用AI算法可能会在扑克中击败您

2020-07-31 10:32:52　来源：新媒体传播网

来自Facebook AI Research的一组研究人员现在已经创建了一种更通用的AI算法，称为ReBel，它可以比至少某些人类更好地玩扑克。根据最近发表的有关该主题的研究论文的报道。该团队由Noam Brown，Anton Bakhtin，Adam Lerer和Qucheng Gong组成。

更具体地说，该团队声称，新的AI可以比以前的任何扑克专用AI更好地玩单挑德州无限德州扑克游戏。该团队说，这是一个大胆的主张，但已经得到了实验的支持。研究人员让ReBel与Dong Kim和其他三位顶级人类玩家对垒，后者比以前的AI掌握的领域知识更少。作为参考，在平视扑克方面，金先生被认为是世界上最好的球员之一。

ReBel的演奏速度超过了每手2秒，而在7,500手牌中用不着超过5秒。但是结果更加令人印象深刻。Facebook以前的扑克人工智能Libratus在千分之一的盲注中获得了147分的总得分。它以29分的优势击败了Kim，平均偏差为78分。相比之下，ReBel得分为165分，标准偏差为69分。

Facebook ReBel AI如何工作?

ReBel通过扩展与“游戏状态”相关的概念并结合了游戏和策略的常识来有效地工作。更简洁地说，它通过训练两种AI模型进行操作，一种通过增值学习来实现价值，而另一种则用于政策。在游戏过程中都使用这两种模型来生成公共信念状态。

这意味着它可以有效地在可能的动作和游戏状态的定义的有限序列上创建概率。在扑克中，公众信仰状态由参与玩家可以做出的各种决定组成。也考虑了给定牌局的潜在结果，以及总彩池和筹码。

ReBel使用所有这些信息来创建基于初始PBS的“子游戏”。整个过程中都使用强化学习来发现新的价值，并向价值AI模型添加示例。重复直到AI达到指定的准确性阈值为止。

如何使用此AI?

如上所述，与为玩游戏而构建的其他AI相比，ReBel不太依赖领域知识。就是说，它比一般的游戏规则更普遍。如前所述，这又回到了扑克游戏中存在的不确定性和未知信息。

综上所述，该AI与Google于2017年创建的更专业的AI截然不同。

相反，研究人员指出ReBel推动了AI算法向更通用的方向发展。即，针对涉及预定因素较少的环境的用例。具体而言，研究人员指出“不完美的信息多主体交互”。他们列出了用例，例如拍卖，谈判，网络安全和自动驾驶汽车。

这并不是说该AI会很快出现并在现实世界中得到解决。研究人员指出，Facebook当然不会发布ReBel代码库。这只会为想要欺骗真实，高风险游戏的系统的用户铺平道路。但是，研究人员断言，该算法确实是进行诸如上述技术之类的进一步研究的合适领域。

郑重声明:本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

热点推荐

· 看看在黑暗中发光的三菱Evo汽车
Dip Your Car进行了一项实验，将三菱Evo转变为夜光汽车，其结果发布在同名的YouTube频道上。事实证明，将荧光漆涂在具有光亮层的身体上并
· Memoji现在可以在最新的苹果iOS 1...
我认为这是我们只能与Emojis聊天的时候了，您的朋友仍然会理解您要说的话。如今，随着疯狂的表情符号数量的增加，您可以从表情符号选项卡中
· 联想使用高通Snapdragon 865制造...
根据在weibo com上发布的图像，看来联想可能会推出自己的游戏智能手机，该智能手机将配备高通公司的顶级Snapdragon 865芯片组。此外，发布
· 新消息确认荣耀X50Pro5G智能手机的...
昨天，realme宣布将在线发布 realme X50 Pro 5G。但很明显，该公司无意放弃这种戏弄，最新消息证实该智能手机的显示屏将具有90Hz的刷新
· 在2020年亚马逊Prime Day期间可获...
亚马逊2020年Prime Day为各种耳机带来了很多优惠，包括索尼的新型WH-1000XM4无线耳挂式耳机，该耳机具有市场上最好的噪音消除功能。这套特
· 索尼最好的降噪耳机在Prime Day上...
如果您从Verge链接购买商品，Vox Media可能会赚取佣金。请参阅我们的道德声明。2020年黄金日的第二天也是最后一天，但接下来的几个小时仍
· Spotify现在拥有自己的iOS 14小部件
自iOS 14发布以来的几周内，越来越多的应用程序在增加新功能，以利用Apple最新更新中的功能。现在，Spotify也加入了。今天，领先的订阅音
· 苹果TV应用程序出现在Sony的一些最...
如果您从Verge链接购买商品，Vox Media可能会赚取佣金。请参阅我们的道德声明。苹果的Apple TV应用程序首次进入了Android TV。索尼宣布
· 宏G支持G-Sync的27英寸4K 144Hz游...
如果您从Verge链接购买商品，Vox Media可能会赚取佣金。请参阅我们的道德声明。宏A在亚马逊上的27英寸4K Predator游戏显示器的闪电交易持
· 谷歌Glass正在添加Meet 以便远程...
您可能已经有一段时间没有考虑过Google Glass了，但其抬头显示器的企业版却有了一个巧妙的新技巧：它将能够使用Google Meet(以前称为Hang
· 贝尔金的首批MagSafe产品是外观精...
苹果公司新的MagSafe配件生态系统还没有建立一天，但是Belkin已经开始使用新的使用磁性充电系统的充电配件，并推出了新的BoostCharge Pro
· 谷歌的新手势系统将可用于所有Pixel设备
除了触摸屏幕或按下按钮外，我们还有许多其他方式可以与智能手机进行交互。借助最新的Google Pixel 4 系列的Motion Sense ，我们可以
· 华为于2020年推出其6nm麒麟820 5G芯片
华为最近宣布，他们可能会推出新的麒麟820 5G芯片组，该芯片组将在2020年2月24日晚上9点举行的在线会议上揭晓。根据gizchina com的声明，
· 华为将开发一款具有多达8个摄像头...
最近花姐发现有诸多的小伙伴们对于华为将开发一款具有多达8个摄像头传感器的智能手机吗这个问题都颇为感兴趣的，大家也都想要及时了解到华
· 配备64MP AI Quad相机的荣耀6系...
realme在其官方网站上发布了一张图片，其中提到realme 6系列(包括realme 6以及Pro变体)将于2020年3月5日发布。虽然关于上述智能手机的完
· 未来的智能手机会使用用户可更换的...
根据fd nl上的一份报告，看来欧盟正在制定一项提案，要求智能手机具有用户可更换的电池。这是由于以下事实：用户通常将旧的智能手机换成较
· FlyPods 3是HONOR为您呈现的全新...
除了HONOR View 30 Pro 和HONOR 9X Pro，HONOR在巴塞罗那举行的发布会上也给我们带来了另一个惊喜。该公司已经宣布了名为HONOR FlyP
· LG推出V60 ThinQ 5G智能手机和改...
大约两周前，我们得到了LG即将推出的旗舰智能手机的渲染图，暗示了其内部外观。好吧，渲染似乎很准确。LG正式发布了V60 ThinkQ 5G，已
· 据说苹果的2020年WWDC将举行传闻...
由于使用了COVID-19病毒，该疾病已成功地减慢了速度，并取消了大多数事件。最近的一次是2020年世界移动通信大会，也有谣言说东京奥运会也将
· 三星为下一代智能手机推出12GB LPDDR4X DRAM
三星宣布将发布其用于下一代智能手机的新型12GB LPDDR4X DRAM，该芯片旨在用于未来的手机。我们可以预计，今年新的12GB LPDDR4X DRAM将

新媒体传播网

Facebook ReBel通用AI算法可能会在扑克中击败您

相关文章

热点推荐

点击排行