烽巢网23日新闻,“人工智能”一词从一开始就被用于视频游戏,但它很少意味着真正的人工智能。相反,它是一个通用术语,用来描述一个预先编程的对手或一个假装聪明的角色,但实际上只是遵循一套狭窄的指令。不过,这种情况正在慢慢发生变化——那些制作视频游戏的人正在帮助他们。
在今天的GDC上,EA宣布他们已经在2016年的WWI射击战场1中训练AI特工。该公司表示,这是第一次这样的工作已经完成预算的AAA级标题(这是有争议的),但更重要的是,它说它的方法的发展将有助于改善未来的游戏:提供更严格、更现实的人类玩家的敌人,给开发人员调试软件的新方法。
与机器人不同的是,EA的人工智能代理将学习如何玩,而不是仅仅遵循指令,而是采用了两种标准方法的结合:模仿学习和强化学习。这两项工作都和你预期的一样。第一部分是观察人类球员,然后试图模仿他们。EA告诉我们,这大约占了他们知识的2%,并使他们走上了正确的道路。
在最初的学习完成后,经纪人必须自己找出游戏的剩余部分,并奖励完成任务(比如杀死敌人),帮助他们经历一个不断尝试和犯错的过程。强化学习。EA的经纪人以加速的速度玩了成百上千的战场游戏,并随着时间的推移而提高。它类似于DeepMind训练它的go -play AI的方法,尽管后者更注重战略思维。
你可以看到机器人在下面的行动:
在对《边缘》的采访中,该机器学习部门的负责人马格诺斯·诺丁说,人工智能的特工们被证明是很有能力的战场玩家,但绝对没有人类那么好。“我们确实对内部骰子开发人员进行了测试,他们是正派的,但不是专业人员。他们轻而易举地击败了机器人,但这并不是一次彻底的失败,”诺丁说。
在训练过程中,机器人学会了各种技能。例如,他们学会了如何调整瞄准枪的目标,并且被证明非常擅长躲避子弹。“为了不被击中,它们从一边跳到另一边,”诺丁说。
但他们的一些行动表明,在人工智能代理能够像人类一样自然地玩电子游戏之前,还有多远。诺丁解释说,这些机器人开发了一种特殊的“扫描”行为,在那里他们会四处寻找与之互动的东西。这是因为他们接受了强化学习的训练,如果他们的成绩提高了,或者他们获得了多余的健康和弹药,他们就会奖励他们。后一种奖励被加入,因为EA的研究人员认为它会鼓励代理商探索地图(以及帮助他们生存)。但它也有限制其野心的副作用。“当他们没有看到任何敌人时,他们就会开始搜寻一些事情来做,”Nordin说。你可以把它想象成一只狗在寻找食物,因为它很无聊。这不是不明智的行为,但也不是那么聪明。
“比赛越复杂,挑战就越好。”
Unity的高级机器学习工程师Arthur Juliani说,EA的工作与之前在这个领域的研究相似,但仍然是可靠的。“结合这些方法,并证明它们可以用来训练可以在真正的游戏中部署的特工,这是一个令人兴奋的前景,”Juliani告诉The Verge。他指出,OpenAI和DeepMind等机构的研究人员正在致力于打造他们自己的机器人,比如《星际争霸2》和《Dota 2》。“游戏越复杂,挑战就越好,”Juliani说,不过他补充说,传统游戏对训练新类型的行为仍然非常有用,因为它们在计算上的强度更小。
Nordin承认在像国际象棋和围棋这样的游戏中所做的人工智能工作,强调了像战场一样的第一人称射击游戏的复杂性。在棋盘游戏中,你有一个完整的世界模型和有限数量的可能结果,这是一台计算机可以详尽地建模,然后选择最好的选项。在射击游戏中,玩家必须同时按下多个键——行走、奔跑、蹲起、开火、重装、交换武器等等——以及所有这些可能的动作,以及试图预测他人动作的组合,使得任务变得更加复杂。
对于EA来说,其目的不一定是要进一步开发AI的一般领域,而是要了解这项技术如何为游戏开发者带来好处。诺丁说,他不认为我们会看到人工智能球员在一段时间内对人类产生影响。“他们不会进入下一个战场,因为那不是很远的地方,但可能是在那之后——作为传统人工智能和神经系统的混合体。”