德州扑克人工智能大赛,人工智能的打牌技术又是怎样的呢?

Bitget下载

注册下载Bitget下载,邀请好友,即有机会赢取 3,000 USDT

APP下载   官网注册

大家好,如果您还对德州扑克人工智能大赛不太了解,没有关系,今天就由本站为大家分享德州扑克人工智能大赛的知识,包括柯洁落败阿尔法狗,除了围棋,人工智能的打牌技术又是怎样的呢?的问题都会给大家分析到,还望可以解决大家的问题,下面我们就开始吧!

本文目录

  1. 为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能?
  2. 人工智能会杀死人类吗?
  3. 人工智能可以在麻将领域秒杀麻友吗?
  4. 柯洁落败阿尔法狗,除了围棋,人工智能的打牌技术又是怎样的呢?

为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能?

科普一下。现在人工智能的发展已经到了在各种棋类游戏中没有人能战胜的阶段。人类围棋的顶尖棋手和AlphaGoMaster的网络对战成绩是0:60。而Master还不是AlphaGo的最高级版本。而1997年IBM的深蓝战胜了等级分排名世界第一的棋手加里·卡斯帕罗夫。战绩3.5:2.5(2胜1负3平)。19年后Google的AlphaGoMaster也战胜了等级分排名世界第一的棋手柯洁。

那么现在人类顶尖棋手和AI到底有多大差距呢?唯一战胜过AlphaGoLee的韩国著名顶尖棋手李世石的隐退棋是和韩国的AI韩豆下的。AI让两子,黑棋贴3又3/4子。在这种条件下开局AI的胜率已经无限接近于1%。但是结果还是AI2:1胜出了。

为什么AI会这么强大?它是怎么超越人类的呢?其实AI的成长过程一直是仿生的过程。所有的棋类比赛较量的都是规则下进行计算的能力。1997年版本的深蓝运算速度为每秒2亿步棋。1997年的深蓝可搜寻及估计随后的12步棋,而一名人类象棋好手大约可估计随后的10步棋。正如中国古代军事家孙子所说:"夫未战而庙算胜者,得算多也。未战而庙算不胜者,得算少也。多算胜,少算不胜,而况于无算乎!"。

那么为什么计算机要19年后才能在围棋上战胜人类呢?还是计算的问题。围棋对AI的挑战难点在棋盘空间。国际象棋的空间状态是1043。而围棋是10170个状态空间。这样的游戏具有高分支因子。围棋中的可能场景的数量要大于宇宙中的原子数。光照顾了棋局的宽度(变化)就照顾不了棋局的深度(考虑的步数)。所以围棋职业棋手2016年之前一致认为计算机不可能下过人类顶尖棋手。

从当时的情况看计算机确实是有点“机关算尽”了。于是科学家们开始研究新的思路。在资源有限的情况下人是怎么办的?最典型的例子是种花、果时要打尖、疏果。因为植物的营养是有限的。不打尖、疏果就不能得到好的结果。围棋棋盘上的空间状态虽然多但是每个空间状态的价值是不同的。所以对变化的计算要剪枝。问题转化为应该剪除谁?

解决这个问题的就是蒙特卡洛算法和神经元网络的深度学习。

什么是蒙特卡洛算法?举个例子:有一个箱子里边有无数个苹果。想找出最大的。但是人从外边看不到苹果的大小。每次可以随机取出一个。然后和上一次的比较。大的留下。这样重复100次、1000次之后是什么结果呢?留下的不一定是最大的苹果,但一定是在目前最接近最大苹果的苹果。

和蒙特卡洛算法对应的是拉斯维加斯算法。也举个例子:还是,一个箱子里边有无数把钥匙。想找出能打开一把锁的钥匙。还是每次可以随机取出一把来试。打不开扔掉。这样重复100次、1000次之后是什么结果呢?有可能碰上了,但是不保证一定能碰上。

人下棋时是通过过往的经验来做选择。AI也是通过过往的经验找出最接近正确答案的值给每一个选择点赋值。而人们看到的是每着的胜率。

AI是怎么给每一个选择点赋值的呢?这就离不开神经网络和深度学习。人能思考的物质基础是人的神经网络。AI的神经网络系统就是仿生的结果。有了这个物质基础就有了机器学习。深度学习是机器学习的一部分。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力。深度学习是一个复杂的机器学习算法,又分为有监督学习和无监督学习。

老师留作业,学生做习题集。其实就是一种有监督学习。通过做题掌握了解题规律。于是考试时只要是做过的题型基本上都会。

现实生活中还常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。比如在没有计算机的情况下人通过对大量的数据长期观察思考,找到了克山病的原因。但是这个研究发现其规律的过程长达几十年。AI的无监督学习就是模拟人的这个学习过程。可以加快人们对未知事物的理解。

深蓝和阿尔法狗最初都是用人类的棋谱喂养的。比如战胜李世石的AlphaGoLee就大约喂了16万人类棋谱和数万个人类人类总结的模式(定式)。但是最后开源的AlphaGoZero则是从零开始通过“左右互搏”自己通过超过1亿对局自己悟出的围棋真谛。自学成才的AlphaGoZero水平不但远超AlphaGoLee,就连横扫千军的AlphaGoMaster也不是AlphaGoZero的对手。这就是职业棋手说的AlphaGoLee的棋还能看出高明的地方(因为有人类的影子),AlphaGoZero的棋则净是看不懂的地方。许多过去的共识被纠正。数以万计的定式被废弃。

2005年左右《围棋天地》曾经有一个栏目是访问一线棋手:如果有围棋上帝的话你和他有多大差距。记得当时一致的看法是让两子。而现在顶尖棋手和AI的差距已经差了两个子。那么AI是不是围棋上帝呢?肯定不是。它只是接近最优解,而不是最优解。也就是说AI只是相对真理,是绝对真理的一部分。它并没有穷尽真理。最好的例子就是“芈氏飞刀”。这个定式是在流行AI定式的大形势下人类发明的定式。最开始AI也不认识,吃了亏后变成AI在一个时期里的常用定式。

AI的发展还远没有达到尽头。从AlphaGoLee到AlphaGoZero都有一个习惯就是见好就收。前边优势很大但是当它算到怎么下都能赢的时候就会退让。最后只赢一两目。作为人类棋手的陪练这是不称职的。所以人类要给它增加个性。中国的AI星阵就加入了“不退让”的个性。

曾经有人预言AI会使围棋衰落。我不这么认为。古代无论东西方绘画都有追求像的趋势。但是当照相机出现后,画得再像也赶不上照相机。但是绘画仍然向前发展并没有衰落。只不过现在追求的是意境和感受了。围棋在商业因素的影响下从两日制演变到包干制的快棋。人的能力在哪摆着,棋的质量不可能不受影响。当信奉“天下武功唯快不破”的时代遇到任谁也快不过的AI。这种“快”还有意义吗?

人工智能会杀死人类吗?

我们知道近几年来人工智能技术的发展速度相当迅猛。前几年,由谷歌研制的具有深度学习能力的人工智能程序阿尔法狗(AlphaGo)第一个击败人类职业围棋选手、第一个战胜围棋世界冠军。经过多次比赛结果显示,阿尔法狗的能力已经远远超过其他人类围棋大师。我们不得不感叹人工智能的强大,于是我们有了疑问:是不是人工智能已经超过人类,人类的未来将会是怎样的?

目前来说,人工智能的的发展还处于弱人工智能时代,人工智能的终极目标是希望机器能够模拟人类大脑新皮质,理解自然语言,并拥有“自我意识”。“自我意识”是指能够拥有自我思维,意识自己和周遭的存在。那时候,一个的由人类创造的新物种将会诞生,人工智能将进入超强人工智能时代。人工智能将变得越来越复杂,越来越聪明,更具有创造性。

任何一项新技术的诞生对人类来说都是一把双刃剑。随着人工智能的发展,人类也许会攻克癌症、艾滋病等一些疾病是现在人类所无法达到的医疗技术,以及人类对资源的利用、太空探索、人类文明的延续等等与人类息息相关的都将会取得重大进步。而另一方面,现在生物医学技术成为一项新技术,并呈指数级发展。互联网上,每秒比特的传递量每16个月就翻一番。可以说生物医学技术与计算机科学技术的结合发展是相当迅速的。人工智能将呈指数级发展,在“奇点”来临时将会迎来“智慧大爆炸”。那时,真正人工智能产生,并以比人类进化速度快的多的速度进化,人工智能将比人类聪明的多。我们担心我们研究人工智能是不是自掘坟墓,人工智能会不会对人类构成威胁。人工智能也许不会将人类全部杀死,但是也许会对人类未来的发展产生重大影响。

人工智能可以在麻将领域秒杀麻友吗?

嗯...这个问题很有意思,我觉得这个问题没得说,肯定是能够秒杀麻友的!

在人工智能在围棋上赢了世界高手后,很多人都在思考同样的问题,在自己所擅长的领域,人工智能能有多大的作为。在麻将领域,感觉似乎根本不是对手(抛开老千什么的)。下面说说我的理由。

1、人工智能能关注到每一个细节的变化和痕迹。可以根据你出的牌桌面上的牌,别人的牌,靠算法应该能基本算出别人的牌。越打到最后你的牌在人工智能眼里越明了。

2、人的体力脑力是有限的,没办法跟人工智能比。任何人都要看状态看发挥,但是人工智能永远都是稳定发挥。

3、人工智能是靠机器记忆的,人暂时是比不过的。人工智能多打几把牌,基本就能像电视里演的那样布局了,哪张牌在哪里哪张牌在哪个手里。这个技能靠人为是很难做到的,但是靠算法是能实现的。

不知道多久以后会不会出现一个麻将机器人打遍天下无敌手……

以上仅个人愚见,欢迎拍砖,欢迎留言区留言讨论

柯洁落败阿尔法狗,除了围棋,人工智能的打牌技术又是怎样的呢?

国际上比较受关注的人工智能打牌有两个:德州扑克以及桥牌。这两个项目很有技术含量,2017年人工智能顶级会议NIPS上的最佳论文,不是Deepmind终结各种棋类的AlphaZero,而是德州扑克1V1战胜人类的Libratus(冷扑大师)。桥牌人工智能的水平还比较低。

打牌时,一般各家的牌是互相看不见的,所以叫“非完全信息博弈”,比“完全信息”的棋类难度高。开发打牌机器人用的技术,与开发下棋机器人用的不一样。例如Libratus就没有用现在十分流行的深度学习与神经网络技术,而是用较为传统的优化算法(当然也很专业)。

在德州扑克上,人工智能解决了1V1(机器与1个人类对战)。2017年1月30日,CMU开发的Libratus击败了四位人类顶级职业扑克玩家。比赛共打了20天,四人分别对战Libratus,玩了12万手,最终AI令人信服地取得了统计性的压倒胜利。

上图是四位人类玩家与Libratus每天的收益表,人类越输越多。Libratus还曾经到中国(新闻中名为“冷扑大师”)与中国“龙之队”对战,中国玩家输得更多。

德州扑克更常见的玩法是多人在一张桌上混战,比1V1更为复杂。这方面人工智能学界还需要开发,但预计没有本质的困难。

另一个在西方比较受关注的扑克类竞技项目是桥牌,这也是中国体育总局明确纳入体育竞技项目的唯一扑克类,各级别的智力运动会都有桥牌项目。桥牌项目是四人打,分成两边对抗,需要两个同伴相互配合。

在桥牌项目上,人工智能也有了一些进展,在国际流行的BBO桥牌网,中国的新睿桥牌网上,都有机器人自动打牌。但是从目前的技术水平来说,机器人打桥牌的技术还不行,经常作出令人哭笑不得的打法。打桥牌需要更多的逻辑与概率思考,比德州有更多的逻辑,而且需要两边配合,理解同伴与对手的行为,对人工智能还是相当有挑战性的。

目前桥牌人工智能对于确定性的局面,能够给出确定性的答案,如四家牌明了,最佳攻防结果是什么,牌手们都相信机器给出的结果。但是桥牌的精髓正好是不确定性,攻防双方需要在不确定性的概率里找到最佳方案。在只看到自己牌的叫牌阶段,如何达到最佳定约,非常复杂,人工智能还没有很好的开发方向。

德州扑克,是世界上奖金最多的竞技项目(世界冠军奖金上千万美元,职业玩家收入也很高)。桥牌是智力游戏里牌类的代表。人工智能在这两个项目上还需要新的技术突破,特别是桥牌。至于其它牌类,如斗地主、80分之类的,甚至麻将,技术含量要低很多,不会是研究热点。

德州扑克人工智能大赛的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于柯洁落败阿尔法狗,除了围棋,人工智能的打牌技术又是怎样的呢?、德州扑克人工智能大赛的信息别忘了在本站进行查找哦。

德州扑克人工智能大赛,人工智能的打牌技术又是怎样的呢?文档下载: PDF DOC TXT