DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

极客号(Daydx.com)8月25日 消息:谷歌DeepMind开发了一个集成系统AZdb,将多个AlphaZero AI系统组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。

DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

DeepMind使用“行为多样性”和“响应多样性”技术,AZdb 的AI系统被训练以不同的方式下棋。根据Google Deepmind 的说法,行为多样性最大化了AI系统之间平均棋子位置的差异,而响应多样性则使AI系统面临针对不同对手的游戏。在实践中,这也意味着 AZdb 的AI系统将看到更多不同的位置,扩大分布数据的范围,这应该允许系统更好地泛化到看不见的位置。

研究人员让AZdb与旧版AlphaZero下棋,结果显示AlphaZero Db的ELO评分提高了50分,在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。

这证明了多AI集成的优势,AZdb可以考虑更多可能性,更好地推广到未知棋局。

AlphaZero Db展现了更高的国际象棋水平和泛化能力,这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2023年8月25日
下一篇 2023年8月25日

相关推荐

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息