你认为你是伟大的在雅达利游戏吗?一个新的人工智能设备从字母表子公司DeepMind叫Agent57可能证明你错了。该公司声称其人工智能能打败的平均字符57雅达利2600场比赛。

雅达利游戏
(照片:Pixabay)

Agent57利用一种叫做深强化学习系统学习的学习从错误和得到更好的在玩游戏。一个研究DeepMind周二发表的解释了为什么游戏是一个非同寻常的方法检出人工智能如何工作。

还读:人工智能的放贷空间延续人类的偏见

游戏是试验场测试人工智能算法

游戏,根据研究,构建自适应算法是一个优秀的试验场。研究小组称人工智能提供一个豪华套房的任务,玩家必须开发复杂的行为策略。

DeepMind使用相同类型的设备掌握增加其人工智能机器AlphaGo,打败了33岁的大师的历史中国游戏和李Sedol,在2016年。Elon Musk人工智能能够实现这样的壮举十年前当AlphaGo赢得第一轮对抗Sedol。

一些最具挑战性的游戏Agent57不得不解决滑雪,Solaris,陷阱,蒙特祖玛的复仇。而其他人工智能结构与视频游戏经历了一段艰难时期,Agent57比任何人工智能已经能够做的更好。DeepMind的创新的总体性能已超过一般人第一次。

发现的人工智能陷阱蒙特祖玛的复仇具有挑战性因为游戏需要大量的策略。Solaris滑雪另一方面,使用人工智能时间既是游戏需要决策技巧。

还读:人工智能纳米机器人植入体可能在20年内产生超人

总冠军:Agent57

总的来说,Agent57能够超越人类不管这些挑战。研究人员写道:他们成功地建立一个更一般的智能代理,在性能与Agent57 Atari57基准中的所有任务。

“Agent57与越来越多的计算规模,”该报写道。研究人员表示,该数据无疑可以提高效率。“虽然这使Agent57实现强大的一般性能,需要大量的计算和时间,”他们说。

雅达利2600于1977年被释放,和成千上万的控制台已售出1980年的援助。雅达利永远改变了游戏,其游戏维护大量“粉丝团”。标志性的视频游戏像陷阱!,Missile Command, Space Invaders, Asteroids, and more are nonetheless played by using people around the world.

Meta-mind

迎接挑战,Agent57汇集了多个升级DeepMind使得其Deep-Q网络,人工智能,首先打败几个雅达利2012年奥运会。

然而,当今世界最好的深度学习模型不是很通用的他们的成功。训练一个人工智能在不止一个excel的使命是一个最大的公开挑战深度研究。

虽然Agent57可以发现方法57玩视频游戏,它不能处理或进行所有57视频游戏。每个新游戏的人工智能的欲望再培训,尽管它可能使用相同的算法。真正的多功能性,人类婴儿没有问题,还有很长的路过去的人工智能的范围。

ⓒ2023 T万博体育登录首页ECHTIMES.com保留所有权利。不复制未经许可。