DeepMind的AI正在努力打败星际争霸II内置AI

lucky☆star · 发表于 2017-8-11 14:10 · 北京

https://www.bloomberg.com/news/a ... estone-starcraft-ii
付费墙

围棋人机大战AlphaGo击败人类，让人工智能正式进入大众视野。而开发出AlphaGo的人工智能公司 DeepMind（Alphabet公司旗下的人工智能公司）早已将《星际争霸2》（StarCraftⅡ）作为人工智能实验的下一个目标。但到目前为止，对于该公司的算法来说，这被证明是一个艰难的领域。

AI眼中的《星际争霸2》

该公司在周三的一篇博客文章中说，DeepMind现有的算法，包括那些在经典的Atari游戏中使用超人类技能的算法，“无法赢得一场针对最容易内置人工智能的单一游戏”，更不用说挑战熟练的人类了。
该公司表示，其软件代理商将需要在机器学习方面取得新的突破。这篇博客文章并没有透露DeepMind可能会有多大的突破。
《星际争霸2》是由暴雪娱乐在2010年7月27日推出的一款即时战略游戏。由于游戏极其考验玩家对资源的运营策略，因此也被视为AI研究的突破点之一。
早在2016年11月份，DeepMind公司就宣布与暴雪娱乐合作，将针对《星际争霸2》展开一系列的研究实验。
然而，目前人工智能对《星际争霸》的探索还处在非常早期的阶段，不仅需要训练各种「常识」，而且在面临突发情况时的应变能力也有所不足。

海岸线zjl · 发表于 2017-8-11 14:21 · 辽宁

星际争霸2的ai连人都打不过，用它做练习对象。。

wildpan · 发表于 2017-8-11 14:28 · 吉林

游戏的内置AI会作弊吧，WAR3的AI不用探路就能直接找到你家。而且人工智能要和人PK也要用键鼠作为输入手段。

lucky☆star · 发表于 2017-8-11 14:33 · 北京

wildpan 发表于 2017-8-11 14:28
游戏的内置AI会作弊吧，WAR3的AI不用探路就能直接找到你家。而且人工智能要和人PK也要用键鼠作为输入手段。 ...

游戏内置AI＝上帝视角不清楚开发者给AI什么权限 DeepMind的AI应该是和人类一样去操作游戏，至少是从画面来思考策略而不是直接读程序数据。

和谐异类 · 发表于 2017-8-11 14:44 · 重庆

要设计算法在星际2打败人类应该比下围棋困难很多。

darkfather · 发表于 2017-8-11 14:46 · 贵州

DEEPMIND是模拟人类行为，能看到的东西也和人类选手一样仅限于当前屏幕，和全屏上帝视角作弊的内置AI简直云泥之别，不要拿来比较

wgzhouf · 发表于 2017-8-11 15:02 · 浙江

电脑很可怕的，还会拉扯真行，像我这种萌新只会A过去

就是个笑话 · 发表于 2017-8-11 15:08 · 四川

本帖最后由就是个笑话于 2017-8-11 15:12 编辑

嘛，这东西目前是个跨领域的，涉及到的技术难点不好解决

先说下alpha go围棋的要求

（1）当前输入数据为：棋盘布局（黑子+白子位置），当前局数，历史吃子数。所有数据都是100%可知
（2）对时间没有特别严格要求，遵循计时器规则

~

然后是星际
星际和围棋有着较大区别

（1）输入数据。不能是后台数据，因为这样子就涉嫌作弊了，这并不是真正意义上DeepMind追求的AI形态。当然训练的时候可以用后台数据，但是测试的时候禁止

（2）既然输入数据禁止后台。那么只能依托于CV也即computer vision的形式输入。
这又是个非常麻烦的东西。
涉及到图像的识别（image recognition），视频的识别（video classification）还有事件的识别（event recognition）还有行为的检测（action detection）还有目标的追踪（object tracking）等等多个cv的学科

为什么要这么做，主要是因为公平起见，计算机的视野和人类是相同的，它也只能“看见”游戏画面里面的东西

这样一来，他首先必须要分析画面里动了的东西都代表了什么。
一个作战单位，朝向任何一个方向做出的举动意义是什么，等等

（3）上面只是分析分类。做完了之后，接下来才是他这边要做的事情。
这还需要考虑首先它自己的apm（actions per miniute）打算是多少

如果apm设置为90，也就是一秒平均要1.5次操作。

那么它在677毫秒里，首先必须要用更短的时间完成第二步操作（识别所有目标），然后它才能做出自己的判断。

（4）当然，DeepMind目前的方案里面，硬件成本的弹性很大，所以如果采用***一些的方法的话，一台硬件可以只分析一个兵种。比如机枪兵和***，对应各自独立的硬件去进行监管。这样子每一个类别都可以是一个二分类（binary classification）的问题了，还可以做成并行运行的

~

总的来说，目前问题就是出在第二步，也就是计算机视觉这一块

如果，这个ai 能取得所有的后台数据，那么很多问题就不是事儿。因为后台数据是100%准确的，比如每个作战单位的id，血量，攻击方向（精确到浮点数），攻击按下时间（精确到浮点数）等等，全都是100%已知的。

但是现在只能用cv的形式来判断的话，误差就非常大了。
以目前国际最顶级的一些会议的情况来看，全世界也还没人可以做到把星际里面全兵种，全行为都准确识别出来的工作

斯坦福、MIT、牛津等等这些学校包括谷歌、FB、微软这些机构，也都还做不到这一点

darkfather · 发表于 2017-8-11 15:46 · 广东

就是个笑话发表于 2017-8-11 15:08
嘛，这东西目前是个跨领域的，涉及到的技术难点不好解决

先说下alpha go围棋的要求

想太多了，这个项目有暴雪参与的，什么数据都不是问题

就是个笑话 · 发表于 2017-8-11 15:55 · 四川

本帖最后由就是个笑话于 2017-8-11 15:58 编辑

darkfather 发表于 2017-8-11 15:46
想太多了，这个项目有暴雪参与的，什么数据都不是问题

你没看懂我的意思么。。。

后台数据来源不是问题

关键是到底要不要使用~使用后台数据就等同于在作弊了

如果不能使用后台数据的话

现在整个地球上最先进的计算机识别技术也无法做到100%

		自动登录	找回密码
密码			注册

[硬件周边] DeepMind的AI正在努力打败星际争霸II内置AI