A9VG电玩部落论坛

 找回密码
 注册
搜索
查看: 11535|回复: 36

[硬件周边] DeepMind的AI正在努力打败星际争霸II内置AI

[复制链接]

审判者

流放者(禁止发言)

精华
3
帖子
12894
威望
7 点
积分
14464 点
种子
514 点
注册时间
2010-5-20
最后登录
2024-2-6
 楼主| 发表于 2017-8-11 14:10  ·  北京 | 显示全部楼层 |阅读模式
https://www.bloomberg.com/news/a ... estone-starcraft-ii
付费墙

围棋人机大战AlphaGo击败人类,让人工智能正式进入大众视野。而开发出AlphaGo的人工智能公司 DeepMind(Alphabet公司旗下的人工智能公司)早已将《星际争霸2》(StarCraftⅡ)作为人工智能实验的下一个目标。但到目前为止,对于该公司的算法来说,这被证明是一个艰难的领域。


AI眼中的《星际争霸2》

该公司在周三的一篇博客文章中说,DeepMind现有的算法,包括那些在经典的Atari游戏中使用超人类技能的算法,“无法赢得一场针对最容易内置人工智能的单一游戏”,更不用说挑战熟练的人类了。
该公司表示,其软件代理商将需要在机器学习方面取得新的突破。这篇博客文章并没有透露DeepMind可能会有多大的突破。
《星际争霸2》是由暴雪娱乐在2010年7月27日推出的一款即时战略游戏。由于游戏极其考验玩家对资源的运营策略,因此也被视为AI研究的突破点之一。
早在2016年11月份,DeepMind公司就宣布与暴雪娱乐合作,将针对《星际争霸2》展开一系列的研究实验。
然而,目前人工智能对《星际争霸》的探索还处在非常早期的阶段,不仅需要训练各种「常识」,而且在面临突发情况时的应变能力也有所不足。

精华
0
帖子
643
威望
0 点
积分
786 点
种子
262 点
注册时间
2017-2-27
最后登录
2022-7-2
发表于 2017-8-11 14:21  ·  辽宁 来自手机 | 显示全部楼层
星际争霸2的ai连人都打不过,用它做练习对象。。

精华
0
帖子
3906
威望
0 点
积分
4107 点
种子
305 点
注册时间
2006-10-27
最后登录
2025-2-25
发表于 2017-8-11 14:28  ·  吉林 | 显示全部楼层
游戏的内置AI会作弊吧,WAR3的AI不用探路就能直接找到你家。而且人工智能要和人PK也要用键鼠作为输入手段。

审判者

流放者(禁止发言)

精华
3
帖子
12894
威望
7 点
积分
14464 点
种子
514 点
注册时间
2010-5-20
最后登录
2024-2-6
 楼主| 发表于 2017-8-11 14:33  ·  北京 | 显示全部楼层
wildpan 发表于 2017-8-11 14:28
游戏的内置AI会作弊吧,WAR3的AI不用探路就能直接找到你家。而且人工智能要和人PK也要用键鼠作为输入手段。 ...


游戏内置AI=上帝视角 不清楚开发者给AI什么权限 DeepMind的AI应该是和人类一样去操作游戏,至少是从画面来思考策略而不是直接读程序数据。

精华
0
帖子
3416
威望
0 点
积分
3469 点
种子
13 点
注册时间
2013-8-5
最后登录
2024-9-8
发表于 2017-8-11 14:44  ·  重庆 | 显示全部楼层
要设计算法在星际2打败人类应该比下围棋困难很多。

骑士

あなたには関係ない

精华
1
帖子
1333
威望
1 点
积分
1680 点
种子
11 点
注册时间
2006-7-2
最后登录
2024-5-18
发表于 2017-8-11 14:46  ·  贵州 | 显示全部楼层
DEEPMIND是模拟人类行为,能看到的东西也和人类选手一样仅限于当前屏幕,和全屏上帝视角作弊的内置AI简直云泥之别,不要拿来比较

精华
0
帖子
2570
威望
0 点
积分
2614 点
种子
5 点
注册时间
2014-8-21
最后登录
2022-6-16
发表于 2017-8-11 15:02  ·  浙江 | 显示全部楼层
电脑很可怕的,还会拉扯真行,像我这种萌新只会A过去

精华
0
帖子
484
威望
0 点
积分
519 点
种子
0 点
注册时间
2017-6-11
最后登录
2017-9-23
发表于 2017-8-11 15:08  ·  四川 | 显示全部楼层
本帖最后由 就是个笑话 于 2017-8-11 15:12 编辑

嘛,这东西目前是个跨领域的,涉及到的技术难点不好解决

先说下alpha go围棋的要求

(1)当前输入数据为:棋盘布局(黑子+白子位置),当前局数,历史吃子数。所有数据都是100%可知
(2)对时间没有特别严格要求,遵循计时器规则

~

然后是星际
星际和围棋有着较大区别

(1)输入数据。不能是后台数据,因为这样子就涉嫌作弊了,这并不是真正意义上DeepMind追求的AI形态。当然训练的时候可以用后台数据,但是测试的时候禁止

(2)既然输入数据禁止后台。那么只能依托于CV也即computer vision的形式输入。
这又是个非常麻烦的东西。
涉及到图像的识别(image recognition),视频的识别(video classification)还有事件的识别(event recognition)还有行为的检测(action detection)还有目标的追踪(object tracking)等等多个cv的学科

为什么要这么做,主要是因为公平起见,计算机的视野和人类是相同的,它也只能“看见”游戏画面里面的东西

这样一来,他首先必须要分析画面里动了的东西都代表了什么。
一个作战单位,朝向任何一个方向做出的举动意义是什么,等等

(3)上面只是分析分类。做完了之后,接下来才是他这边要做的事情。
这还需要考虑首先它自己的apm(actions per miniute)打算是多少

如果apm设置为90,也就是一秒平均要1.5次操作。

那么它在677毫秒里,首先必须要用更短的时间完成第二步操作(识别所有目标),然后它才能做出自己的判断。

(4)当然,DeepMind目前的方案里面,硬件成本的弹性很大,所以如果采用***一些的方法的话,一台硬件可以只分析一个兵种。比如机枪兵和***,对应各自独立的硬件去进行监管。这样子每一个类别都可以是一个二分类(binary classification)的问题了,还可以做成并行运行的

~

总的来说,目前问题就是出在第二步,也就是计算机视觉这一块

如果,这个ai 能取得所有的后台数据,那么很多问题就不是事儿。因为后台数据是100%准确的,比如每个作战单位的id,血量,攻击方向(精确到浮点数),攻击按下时间(精确到浮点数)等等,全都是100%已知的。

但是现在只能用cv的形式来判断的话,误差就非常大了。
以目前国际最顶级的一些会议的情况来看,全世界也还没人可以做到把星际里面全兵种,全行为都准确识别出来的工作

斯坦福、MIT、牛津等等这些学校包括谷歌、FB、微软这些机构,也都还做不到这一点

骑士

あなたには関係ない

精华
1
帖子
1333
威望
1 点
积分
1680 点
种子
11 点
注册时间
2006-7-2
最后登录
2024-5-18
发表于 2017-8-11 15:46  ·  广东 | 显示全部楼层
就是个笑话 发表于 2017-8-11 15:08
嘛,这东西目前是个跨领域的,涉及到的技术难点不好解决

先说下alpha go围棋的要求

想太多了,这个项目有暴雪参与的,什么数据都不是问题

精华
0
帖子
484
威望
0 点
积分
519 点
种子
0 点
注册时间
2017-6-11
最后登录
2017-9-23
发表于 2017-8-11 15:55  ·  四川 | 显示全部楼层
本帖最后由 就是个笑话 于 2017-8-11 15:58 编辑
darkfather 发表于 2017-8-11 15:46
想太多了,这个项目有暴雪参与的,什么数据都不是问题


你没看懂我的意思么。。。

后台数据来源不是问题

关键是到底要不要使用~使用后台数据就等同于在作弊了

如果不能使用后台数据的话

现在整个地球上最先进的计算机识别技术也无法做到100%
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2025-2-25 21:01 , Processed in 0.205639 second(s), 16 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部