欢迎光临讲解机器人网站,如下是我们的文化、产品、品质、服务

讲解机器人网站

讲解机器人网站专业从事智能研发、生产和服务一体化公司

【机器人攻击各种道具训练人类】击败DOTA2的顶级人类玩家。马斯克的机器人强在哪里?

作者:慕青      发布时间:2021-04-15      浏览量:0
文|草原骑士 最近AI圈发生了

文|草原骑士

最近AI圈发生了两件大事。第一个是DeepMind、脸书等AI巨头对《星际争霸》研究兴趣浓厚,公开发布研究工具和数据;二、Open AI的机器人击败Dota2顶级职业选手。至此,在横扫人类象棋大师和围棋大师之后,人工智能现在已经俘获了风靡全球的电子竞技游戏Dota2。可以预见,在很短的未来,备受期待的《王者荣耀》顶级玩家也将被人工智能击败。

DeepMind等公司对《星际争霸》的研究已经有一段时间了,但到目前为止,根据最近刚刚发布的最新进展,相关研究没有取得重大突破。

而Open AI击败DOTA顶尖人类职业选手,率先做出令人振奋的成绩,成为AI圈的热点。

回顾比赛,Open AI公司的机器人表现可以说是非常“强悍”,出手“快”“准”“狠”,技术娴熟,不仅能卡住士兵,补刀,还能取消技能,举手,而且攻击性很强,连续两场比赛残酷辱骂邓迪。

OpenAI工程师表示,他们训练机器人2周,获得了击败全球最好的Dota 2职业选手的能力。看完战况,埃隆马斯克抑制不住内心的激动,在推特上公开宣称,OpenAI创造了历史上第一个击败电竞顶尖选手的人工智能。这比下棋围棋复杂多了。

这次打败DOTA人类玩家有多难?

虽然OpenAI没有发布更多细节,但我们可以在现有信息的基础上做出客观的评价。

1.它属于多人在线战术竞技游戏(MOBA)中的单人模式。这次是中路影魔的SOLO对抗,属于1V1遭遇模式,战争迷雾隐藏的信息少,难度远非5V5模式。在正常的DOTA2游戏中,两个对立的队伍各由五名玩家组成。比赛过程中需要随时调整作战策略,需要大量的团队沟通协调。任何一个玩家都可以根据战斗情况随时召唤其他队友组织支援、抓捕或者伏击。突发情况多,对抗激烈,互相配合,把握节奏很重要。比赛通常需要45分钟。

1v1模式下,击败对手主要靠机械技能和短期策略,不涉及长期规划和协调,而后者是目前AI技术最具挑战性的部分。因此,OpenAI计划明年推出一款更智能的机器人,用于5V5协同作战。

2.DOTA与Go相比,在战斗中机器人的反应时间上有优势。AlphaGo对战柯洁,双方时间为3小时,时间的增加有利于人类玩家的发挥。其实时间对AlphaGo来说并不重要,因为做决定最多只需要10秒。这次DOTA战役不一样。人类玩家在直接面对机器人时,需要几乎瞬间粗略估计出自己和对手的距离,是否进攻,是否值得最后一站,然后通过神经系统发出信号,控制双手操作鼠标和键盘。这一系列动作需要很长时间。OpenAI机器人可以获得对手位置和技能冷却时间的准确信息,快速计算出准确的攻击时间节点,从而保证对手一击毙命。仔细观察战斗过程,可以看到机器人在最大距离发动了几次攻击,最后只用了10分钟就打赢了战斗。

为什么马斯克如此重视机器人的成功?

“自玩”的概念是OpenAI研发的关键。OpenAI机器人的整个学习过程是随机开始的,通过自我对抗来学习。OpenAI首席技术官格雷格布罗克曼(Greg Brockman)介绍说,技术人员已经通过神经网络训练了机器人数千次。自我玩家选择对对手一般行为的最佳反应。所以OpenAI开发的机器人可以从完全随机的状态一步步发展到世界顶级水平。虽然这不是最新最前沿的理论,但令人震惊的是,机器人已经学会了人类玩家已经使用过的技术,并吸收为己用,用来打败人类玩家。

Google开发的AlphaGo在击败人类顶级玩家李世石和柯洁后,宣布永久退出Go。同样,OpenAI也没有开发出这样的机器人来击败DOTA人类职业选手。

通过独立学习游戏规则和自我游戏训练,能够掌握复杂电子游戏的机器人可以有其他更广泛的用途。最直接的例子就是围棋手已经开始学习AlphaGo机器人的下棋方法。同样,一些DOTA游戏玩家开始使用OpenAI的机器人进行日常训练。智能机器人可以为游戏娱乐行业提供更多的价值,游戏娱乐也将促进人工智能技术的快速发展。

人工智能的目标是:建立一个更通用的智能系统

显然,OpenAI的野心不止于此。“我们已经建立了一个通用的学习系统。尽管它在许多方面仍然有限,但它仍然可以击败最好的人类专家,”布罗克曼说。“这是建立更通用系统的关键一步。它可以学习真正复杂而重要的现实任务,比如成为一名外科医生。”

不仅仅是在电子竞技和医疗领域,OpenAI的这项技术可能会在家政服务机器人和军事机器人领域发挥更大的作用。

最近《人民日报》报道,有网友买了扫地机器人后泪流满面,仿佛买了个智障,肆意展示各种傻逼技能:扫地2年,天天卡在卫生间的地摊上,卡在沙发的角落里,卡在各种意想不到的角度里,各种桌腿都无法相处。目前出售的这种扫地机器人有一种救生技能。卡住的时候会发出求救信号,让人把它搬出来,感觉它的主业不玩了

扫卫生,而是负责搞笑卖萌。

可以预见,采用“自我对局”(Self-play)理念来提升扫地机器人的学习能力,可以在随机探索整个室内环境的过程中,通过和自己、和家庭环境进行对抗学习,不断提升对整体环境的感知应对能力,最终达到人类保洁水平。进行更大强度的训练,甚至可以成为一个顶级的家庭卫生保洁员,避免因为被卡住频频向人类求助的窘迫,成为真正意义上的智能家居产品。

在军用领域,“自我对局”(Self-play)的设计理念同样大有可为。2015年9月,美国海军陆战队开始测试谷歌旗下机器人公司波士顿动力开发出的新一代机械狗Spot,而这款机械狗的“前辈”BigDog早就在2014年在夏威夷投入使用了。

这只机器狗只是被看成是可以执行侦察和搜索任务军犬的替代品。准确来说,这不仅仅是一条军犬,进行深度改造后,可以变为一个可以在战区和灾区提供导航,执行搜索任务,排查建筑物危险,装备上武器就可以作战的超级士兵。

同样是激烈的对战环境,在DOTA2中可以迅速准确评估战况、动作灵活、攻击性强的OpenAI公司机器人给我们展示了其强大的学习、超越能力,借鉴和改进机器人背后的通用学习系统,用来提升军用机器人的学习能力、侦查作战能力,对于保存军队有生力量具有重要意义。

创办特斯拉公司大获成功的硅谷奇才伊隆·马斯克,可能正是看中了这项技术蕴含的潜在巨大商业价值而兴奋不已。

智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。