李开复:人工智能自我调整厉害 李思晓:AI包容性强

2017年04月08日10:43 新浪体育 微博
视频加载中,请稍候
畅谈人机战

  4月6日-10日,德州扑克人机大战在海南火热进行。7日,创新工场CEO和著名美女牌手李思晓做客新浪演播间,与主持人回顾了人机大战前2日的赛况。

  主持人:我现在有请李开复老师介绍这次活动背景

  开复:我们可能都关看到今年一月美国CMU卡耐基梅隆大学的一位教授,开发了一套德扑的机器人,而且在美国打败了顶尖的美国高手。因为我自己也是卡耐基梅隆毕业的,所以我就对他发出邀请。看他愿不愿意来跟中国的牌手对抗一下,那么就想阿尔法狗打败了世界冠军在围棋上,那么CMU的这套冷扑大师系统在美国打败了顶尖高手。那这次来到中国,我们是抱着希望,让大家能够看到德扑也是可以有意思的比赛。而且比围棋更有不同的意义。那么也非常开心的是,托马斯教授也带着冷扑大师过来,和我们这次组织的中国龙之队是由杜悦老师,是中国唯一的在VSOP上得过金手链的,带着中国龙之队的六位选手跟冷扑大师做一个为期五天的对抗,这是一个大概的背景。

  主持人:好,那么我们先来看一下这两天的赛况

  4月7日上午,冷扑大师对战中国龙之队德州扑克人机大站表演赛在海南生态软件园传奇智力运动馆结束了第三场比赛,本场六位选手共与冷扑大师打了近4200手牌,共输了124654分,加上昨天的损失,人类在11400手牌里已经落后了191591分。双方的差距也是越来越大了。所以我想问一下在场的三位嘉宾,昨天也有一直在关注这个比赛吧,然后你们对于昨天和今天的表现有什么评价呢?

  开复:我先来说一下哈,一共有三场比赛嚒,第一次人类是输了一万多分,第二次是五万多分,第三次是十二万多分,这其中是有他的道理的,第一个我们可以看到,一万多分基本是一个不相上下的情况,表示中国龙之队确实很强,但是呢,冷扑大师他没打完一次比赛以后呢,一个小节之后,他就会开始机器学习,针对每一位牌手,针对他们所有的弱点,他会调整自己的参数,所以在第二次,第一天下午的比赛,他就已经化身成了六个冷扑大师,针对每一位牌手的弱点调整了自己的参数,呐,他就从一万赢到了五万。第三场,再学习之后就到了十二万。所以我们可以看到机器的自我调整是非常厉害,非常可怕的。

  主持人:呐 李思晓呢?

  李思晓:首先呢我觉得,嗯 这次很有看点,然后因为我不太了解机器,开复老师可能更了解,但是我会觉得比较可怕,我看了之前的一些介绍,包括他不单纯只是从大数据上的一个归纳,而且对人的及时的调整和很多整个德州扑克上的一些专业的学习能力是非常强的机器,因为这一次也是非常有看点,这六位牌手也是代表了中国最顶尖的一个水平,第二我昨天也看了一下,六位牌手所代表的风格也是不一样的,每个人对同样的一首牌的打法是完全不一样的一个处理方式,然后机器对人的一个及时调整也是很快速,你就可以看到他的包容性会是很强的,因为对于完全不同的六种风格的玩家有一个判断,这个还是很厉害的。当然我觉得,从第一场来说,我们人类牌手也有一些非常优秀的地方。

  主持人:好了,我觉得现在应该还有很多观众会就是很疑问这个冷扑大师是一个什么样的存在,所以我特别想问一下开复老师冷扑大师这个电脑程序他是怎么学会打德州扑克的呢?

  开复:其实这个跟阿尔法狗的围棋差别挺大的,因为冷扑大师从来没有学过人的比赛的牌谱,阿尔法狗是先从人的牌谱学起,然后在自我提升,冷扑大师几乎是从博弈论的理论加上德州扑克的规矩自己再不断的推进他的算法,所以他每一次决定的下注或者是不下注,或者每一个决策,他是针对所有人类的可能性然后所有的这种诈和和当真的可能性,做一个对他最有利的判断。那么这个判断呢,下出来以后,无论人是怎么样的回应,他应该都是一个接近最优的,然后他是优化自己的打法,让对手猜不出来自己是用什么风格在做什么事情。而他呢又会去猜,对方是用什么方式,呐,如果你把这个盖子掀开来,它里面其实是一个特别巨大的数据库,他储存了所有牌的排列与组合,还有在这种排列组合之下如何去找到一个平衡点,让对方猜不出来你有什么牌,所以还是一个巨大的统计系统。

  主持:那我想问一下冷扑大师这个存在是否就意味着人工智能会向人类隐瞒信息呢?

  开复:应该是说他的表现是有在隐瞒信息。但是呢,这是人教他去隐瞒的。就是说,现在所有的人工智能的工具无论是机器人、无人驾驶、阿尔法狗或者冷扑大师,他都是人写的代码,人操控的工具,所以他是我们管的,他没有自我意识来去隐瞒信息,他的隐瞒信息他的编程者叫他去隐瞒信息的,所以不用太担心我们的机器人以后会来欺骗我们。

  朱波:其实这里面有一个人工智能的话在一些完全不确定的状况当中,信息不完全清楚的情况下能够做出他自己的最佳判断,这个呢我觉得人工智能能够在德扑做到这个地步的话,其实他的,应该说他的不确定信息,这种架势可能还有更多一点。

  开复:我们可能跟围棋做一个对比的话,围棋它的每一个黑白棋都在你的面上,俩人都知道,没有任何隐藏的,那真是的应用在什么地方?人的真实的应用很少是一切都暴露出来的,那么德扑更像,比如你买一套房子,他是900w 你的心里价位是850w,你是先开出700w再加呢?还是开出840w说我再也不加了,他的这个商业的交谈,谈生意的过程其实就跟德扑是很像的。所以这也意味着德扑能够克服,以后商业谈判啦政治外交啦,国际关系啦,都可能有机器来帮助人,所以把这个应用层面提升的高。

  主持人:好的,那我们昨天和今天上午也看到了很多精彩牌局,那我们来给观众来模拟一下。

  第一手牌是alen是坐在小盲芒位,拿了一个草花4草花10,冷扑大师就是拿了一个草花25,就在大盲位。好我们看一下现在这手牌,这边是冷扑大师,那边是alen,然后一个是小盲,一个是大盲。他们在翻牌前,alen是加注到230

  思晓:对,alen是加注到230左右,一个2.3BB的一个标准的加注

  主持人:对,冷扑大师是平call,平call 130

  思晓:冷扑大师选择了一个抵抗,因为在单挑里面,这个2 5的草花,只是有一个同色,还是可以选,因为只加1点多的1个DB,还是去进行一个抵抗。然后我看到底牌是一个A 6

  10 的一个彩虹的情况,双方的玩家都选择了过牌,在人类这边的一个看法,可能是中了一个中队,然后选择了一个延迟性下注,同时因为我在观察这个冷扑大师的这个打法里面,他经常性的在转牌和合牌在做一些的很超池的一些下注,所以人类基本上在做这种中等牌类的时候会做些严格的控池的情况,冷扑大师很有意思,因为你在正常来说,你跟人类去打在前位回去控池,在后位回去造池,我昨天看冷扑大师经常会做一些匪夷所思的下注和判断,所以人类在这时候想做一个过牌同时引导对手去有一个咋呼的情况。

  开复:其实冷扑大师他是在平衡不同的打法。他只可能一部分像人的打法,一部分像非人的打法。这样更让你猜不透,如果全部非人了你可能也会打得过他。

  思晓:所以是心理上换成是我,因为我不了解那六位玩家,我可能会有一些恐惧

  朱波:现在这手牌是昨天第一天的牌是吧?

  思晓:对 我们现在复盘一个牌,同样的一手牌,然后人和冷扑大师交叉对打。然后造成的一个不一样的情况。

  主持人:我来看一下,第一次底牌后,双方都过牌了。然后底牌又发了一张黑桃3。黑他3出来之后,冷扑大师选择的是下注1911。Alan选择下注到4000

  思晓:我现在扮演的是一个人类

  开复:你扮演的是人类?我以为你人类,你来自外星哦?

  思晓:对 alan现在选择下注到4000,我们给冷扑大师转牌是一张好牌,给了一张补拍,有金有顺的一个层面,基本上是有12-13张的补牌。然后在这个牌面上,尤其是人类有可能是不中,没有任何的关系,所以,差不多是有30%-40%的胜率。所以冷扑大师选择了一个超池的一个下注,你可以看到我刚说的他会有一些很,在一个460的一个底池下面,下了一个将近5倍的一个底池性的下注

  主持人:因为这个发射器上调出来一张。

  思晓:一个是给他自己一个比较好的补牌,同时他可以偷掉对手一个没有任何A的一些补牌,就可以说,因为人类选择了过牌,所以人类有A的可能性,当然我们看到结果却是没有A,有A的可能性也确实没有那么大。那可以打掉对手的JJQQ,或者是KK 这些左右牌,所以冷扑大师选择了一个4倍的底池,会有更多的弃牌率在扑克的数学上面

  主持人:那么alan跟注到了4000又是一个什么意思?

  思晓:Alan跟注到了4000,杜悦老师之前我看他打WSOP时,我看他有一些在转牌上很激进的处理方法,他可能也读到了冷扑大师有可能是一个没有牌在转咋呼的一个情况。所以他做了一个反加注的转咋呼。而没想到冷扑大师选择了跟注。而且杜悦老师比较好,他有一张10 ,是一个对儿的补牌,他这里更多的是扮演一个A 10 或者一个对10的这样的一个范围。

  朱波:是不是Alan这个跟注也是在验这个冷扑大师到底这个牌是不是他真的是成牌,如果是在买牌路上的也有可能就走了。

  思晓:对,一个是转咋呼,同时也是试探对手的一个下注。

  主持人:alan跟注到4000之后,冷扑大师选择了call 齐。然后我们来看合牌掉了一张红桃5,之后

  思晓:我们从减法上来看这个是人类是领衔的

  主持人: 这个是冷扑大师率先带的2197之后alan选择了复牌。

  思晓:这个有点意思哈,换我我可能会call,但是因为转牌的这个加注,然后封锁掉了很多范围,因为在杜悦老师看来,对手不太会去偷底池。所以在杜悦老师看来,对手他的10可能会挂一个比较小的踢脚,有可能是落后了。但是在底池赔率上来说,可能是有10可以去开的,但是因为转牌这样一个反加注的过程,会锁紧一些范围。

  朱波:是不是杜悦老师在考虑他可能是顺?因为这个牌是花顺双出么,翻到5出来这个胜面就很大。

  思晓:因为牌面还是比较湿润的在扑克里面。然后牌在前位先做了一个。因为他觉得他自己是肯定赢不了了么,

  主持人:在底牌后双方都选择check的情况下在10上冷扑大师做了一个open,然后他做了一个跟注之后冷扑大师又继续平call了,然后再合牌掉了一张5之后,冷扑大师继续开枪了。所以alan就选择了覆牌。这个思路是alan觉得冷扑大师成顺了是么?

  思晓:嗯……我觉得alan会觉得冷扑大师有A吧。成顺的可能性并没有那么大。嗯……转牌成顺只有47的一手牌,但是有A 的组合,A 6 A10的组合,包括或者A3 的组合可能会更多一些,而且冷扑大师觉得对手是没有A的。但是这个合牌的下注有点意思。因为这只是单独的一手牌,因为可能他之前了解对手的一个数据,尤其对对手的转牌,我觉得这个牌重点不在合牌,重点是在转牌,一个强行的call的一个跟注。去读到对手一个范围,一个没有顶端的范围。这个是重点。

  主持人:我们来看一下,迹象反过来的时候,我们张淮拿了冷扑大师的这手牌。张淮拿了黑桃25,冷扑大师拿了草花10 4 。他们俩是怎么对决的呢?冷不大师依然在大盲位。然后这个时候在翻牌前,冷扑大师加注到了250,然后张淮跟到600,

  思晓:看到人类很激进啊,看到处理这些手牌。

  主持人:冷扑大师平call 350,call 齐。这时候我们看一下底牌,底牌发出来 6 10 A的时候,张淮是率先加到800,就底池在1200的时候,张淮加注800。然后冷扑大师选择了平Call 800。这个时候你觉得,他们的思路是?

  思晓:首先这个人类的这个翻前反加注很激进啊。可能这个之前也是为了平衡自己的手牌吧。因为冷扑大师太强了,如果我们打的很传统的话,可能就更有劣势。所以可能也会要用一些这种比较极化,我们叫两极牌,比如25这种,代表一些比较强的一些范围。尤其这个翻牌发出来以后,我们看到自己是25,因为我们翻前一些强势的举动,所以我们会代表我们自己手里有A,或者有A的一些组合,或者持续性下注,所以这里是一个很标准的持续性下注。

  主持人:所以张淮加注到了800,所以冷扑大师选择了平call,然后我们看底牌掉了一张黑桃3之后,张淮是继续下注2000,

  思晓:跟刚才拿手牌是一样的么?就是同样是有一个比较好的发展。然后我们又表现的强势,所以我们在这里一个是去塑造这样一个底池,同时看看打对手的一个弃牌率。在这点上打对手的一个弃牌率,冷扑大师做的是一个4倍的底池加注,我们做的是一个不到4/5的一个底池的下注。所以你就能看出冷扑大师对对手的一个弃牌率的处理上,在数学上更精准更凶狠一些。如果觉得对手没有A,他会更激进。

  开复:因为他的每一次的动作的搜索的范围都是无限的,他可以从下100一直call in,他会考虑每一个可能性。然后找到其中的那一个可能性,是可以让他,无论在对手的回应之下,得到平均最大化的回报。

  思晓:对

  朱波:所以他是不是在底池2800的时候加注4/5还是带有邀请性的。想打出价值来。

  思晓:对,这叫双向型下注,这就叫半咋呼,就算对手跟注了我们,合牌也可能也有十几张的补牌。但冷扑大师可能更直接

  朱波:冷扑大师就是我要赢这手牌,我把你吓唬走了。他这里的话更想能够打出价值来

  思晓:这可能就是人类心里和机器这里想的可能不太一样。逻辑上不太一样

  朱波:人类想的我有可能花顺双出,我还是想打点价值

  思晓:然后冷扑大师更没有,更跳出自己的手牌,更数据化的角度来判断。

  开复:那思晓你会考虑用冷扑大师这种打法来作为你以后比赛的打法么?

  思晓:会 而且我刚去打了一场比赛,现在世界上最顶级的这些玩家,也原来越去模仿机器人来下注,所以他一定是有特别优秀的地方,

  朱波:其实这里就可以看出人类和机器的差别,机器就是我要赢,要结果。

  思晓:对

  开复:对

  主持人:我们再来看一下合牌在掉了一张红桃5之后呢,张淮是下注7000,

  思晓:我们人类做了一个6800底池的一个超池

  主持人:冷扑大师是跟注了16600,这是一个两倍多的跟注。

  思晓:有效筹码只有20000

  主持人:他选择了一个all in 冷扑大师直接选择了all in,然后张淮就选择了覆牌。

  思晓:这个很精准啊,首先,在不均等信息的情况下,我们看到了25,但是要是没有看到的情况下,我们可能会觉得对手是有A的情况的,很精准的一个反向的覆牌。他觉得这个牌面组合上面,对手的AK,因为翻前是有动作的。我们逻辑上翻前是有动作的,AK的组合,包括A 10 的组合是小于JJQQ,AJ的这样的一个组合范围。同时,对手手上是有可能有两张黑桃的,冷扑大师手上是没有黑桃的,所以对手有黑桃的可能性会更多,所以对手买牌破产的可能性也会更高。而且我们看到是356,现在牌面上最大的手牌应该是47,冷扑大师手里有一张4 同时有一张10,是可以组合掉很多顶端范围。我们在扑克里面去顶端范围的一些手牌,所以他用他组合掉的手牌去打对手的顶端范围里头这样的手牌,就是对手有47的可能性和对10的可能性又减少了。我们从AKK的可能性有减少了一些。47 的可能性又减少了一些,对10的可能性有减少了一些。那这里面可能对手咋呼的可能要多于他有牌有价值的可能。还是一个数学上面的一个逻辑。那这个时候他觉得下的三条金,他有可能A挂弱踢脚。那个10是不太能开得动牌的。所以他觉得是一个,扑克里面的术语是抓鸡没鸡大,因为存在一个JJQQKK的可能性,因为张淮有可能是有可能有JJQQKK的可能性。如果那10开牌,有可能会输掉。但我们刚才有分析到了,这个有牌的可能性要小与没牌的可能性。组合大于很多。所以他一个反向咋呼是一个非常好的选择。

  主持人:我觉得我刚刚从看这几首牌的时候,冷扑大师做的动作都很流畅,就从翻牌前翻牌后,到转牌到合牌的时候都是一气呵成的感觉。比如这手牌,冷扑大师和刚刚alan的时候就打法是完全的不一样。

  思晓:对,我们总结一下,冷扑大师偷鸡的时候人类没有抓他,而且他判断出了人类在转牌的一个偷鸡,然后去平跟,同时在合牌在阻挡一个偷鸡,这是他拿到25这手牌的时候的一个处理方法。然后人类偷鸡的时候。他去反向偷鸡,反向咋呼。所以这点是很厉害的。

  开复:所以他那两边的牌都赢了。

  主持人:好了,我们来看一下第二首牌。我们来看一下这是王天健和冷扑大师打的一手牌。王天健是A8不同色,是大盲,冷扑大师是5Q不同色。是小盲位。我们来看一下翻牌前冷扑大师是选择下注到250。 大盲位的王天健是选择平call 150。 我们看一下底牌发了843,两个红桃,天健选择在前位过牌。冷扑大师加注到250。就打了一个1/2。

  思晓:这个应该就是一个双方都比较标准的下注吧。持续性下注。因为他是加注者。然后我们人类这边中了一个顶对,在单挑里面也是一个比较好的手牌。所以选择了抵抗,选择了平call。

  主持人:底牌掉了一张黑桃7之后,王天健继续过牌,冷扑大师继续开枪 打了1115。这又是一个超炮。

  思晓:他真的很有意思

  主持人:我觉得冷扑大师的下注很奇怪。

  思晓:昨天看了 一个报道,就是人类他们一个赛后总结的一个报道。这个冷扑大师转牌的一个下注量是一个非常恐怖。就扑克里面我们衡量一个高手的能力也是在转牌。老外起名叫转牌,英文叫turn,为什么叫转牌turn,就理解为种百转千回的意思,就是他决定了这个5张牌后续发展的一个最关键的点,就像我们融资可能A轮B轮之间的那样一个点。所以在转牌上表现的强势,一个是给对手心理上造就一个压力,然后造大这个底池,二是去更好的咋呼。

  主持人:王天健是继续平call 1115,

  思晓:人类已经发现了它这个规律了。然后在转牌做了一个抵对,这个牌面还是比较潮湿的。这个各种的组合。人类还是选择了抵抗。就其实人类也是根据他的打法有一些适当的调整。

  朱波:如果我们反过头来看,如果这时候人类肯换一下,他打1000多,冷扑大师在这上面可能会打一个超炮。

  思晓:对

  朱波:如果反过来,现在王天健是平call,思晓你是冷扑大师你会打多少。

  思晓:极限价值么,就是换一下手牌,如果没有位置的情况下可能会call,如果有位置的话做一些极限的价值

  朱波:如果这时候他是8顶对,又是打踢脚

  思晓:如果人类那这个Q5转牌都不一定赶有动作。

  朱波:是

  主持人:冷扑大师打的很激进啊。我们来看合牌掉了一张方片8之后,王天健是选择率先开枪打了一个3200满池。然后冷扑大师跟注到8900

  朱波:在这一点我就看不懂了。冷扑大师又是采用这种bulafu的方法

  主持人:将bulafu进行到底么?

  朱波:对

  主持人:然后天健选择all in。将底牌加注到了18300,应该是有效筹码都选择了

  思晓:这个逻辑应该是说冷扑大师首先有一张5,我们这个牌面发这张8之前可能这个逻辑是成立的,56是成立的,同时为什么冷不大师选择加注的情况下,对手56的可能性很小。然后对手转牌没有一个反向的加注,和fulaop一个没有转牌的加注,所以代表他有对儿的可能性也是比较小。所以在看合牌的这张8,目前我们是结果论,我们看到王天健手牌很大,但是他觉得对手已经没有葫芦的太多可能性。但是没想到被人类拿了一个对,反向的打了一个更多的价值。这个是人类也对机器人的一个不信任了。但是冷扑大师是有逻辑的。现在前后他是有一定逻辑的,原因就是说,他觉得78和3344的可能性,从fulaopo和turn上已经完全排除掉了。确实是没有。因为人类从始至终没有反向加注。所以这个牌的组合确实是非常小一些。

  主持人:这时候我们的冷扑大师就选择了覆牌。

  思晓:对 没有么,因为实在没办法了。All in

  朱波:那最后天健加注了,冷扑大师又打了8000多,是明显想打他的弃牌率。

  思晓:对 要打他的弃牌率。

  朱波:他如果all in 的话呢?但是他也是跟了,天健肯定会跟

  思晓:对 这是为什么有10%的胜率的一个情况。

  开复:这时候冷扑大师又是考虑了一个整个范围。All in 对他来说是非常不利的。因为对方一接的话,你就没有任何的记分牌了。

  主持人:很聪明啊 这个冷扑大师。

  开复:留下了一万块钱左右。输了10000的筹码

  主持人:我们来看另外一手牌,还有最后一手牌了。这个童舟拿了一个QQ,超对。我们冷扑大师拿了一个红桃47。 Button位是冷扑大师。冷扑大师是选择加注到了250,而童舟是选择翻倍到了799,然后冷扑大师继续选择4倍的加注,3196。这个牌就是安全

  思晓:童舟这个玩家平时也会一起玩儿。他可能是这六个人里面,相对的跟杜悦老师一样是比较激进的玩家。所以我会觉得冷扑大师发现了他反加注的频率,因为他看不到他是QQ,因为他发现经常翻前经常反加注对手。所以他做回了一个继续加注的抵抗。一定是之前的一个大数据,然后造成了他拿47这样的牌,做了抵抗。而且他确实挑对人了。从我的角度来说,这六个玩家童舟是最激进的玩家。

  主持人:然后童舟选择了call 齐。我们来看一下底牌发了10 6 8,有一张红桃。在看到底牌之后,童舟选择了过牌。然后冷扑大师也是选择了过牌,

  朱波:在这个时候冷扑大师的顺面蛮大的。卡5 卡9

  主持人:那我想问一下童舟为什么要选择过牌么?

  思晓:因为他也会担心么?因为翻前对手很激进,而且这个牌面也很复杂。感觉是一个超对,但是其实如果打下去AKK不赢,同时有可能撞到赢对手一个手对J,手对9都没有那么大一个胜率。有7和9的一些补牌在上面。所以这牌给我拿QQ,可能翻前我可能会推掉吧。这就是一些不太一样的玩法。当然,可能童舟和机器人打的更多,可能他会有他自己的一些想法。

  开复:其实,如果你技不如人的时候,不如翻前推掉

  思晓:对对

  开复:而且你觉得你有50%的胜率,就推掉,因为之后你还可能更落后了。

  朱波:真的,如果我技不如人的话,我看到QQ我在翻牌前结束战斗。我们两条鱼肯定是推掉了

  开复:我们两条鱼肯定是推掉了

  主持人:我们看到翻牌前底池就可能到了6392,我们来看转牌。发了一张黑桃4。这个时候冷扑大师是有对了。童舟是选择开枪。加注到4505。而冷扑大师选择了平call。这个时候冷扑大师的几手牌没那么挤进去,是因为底池已经很大了。就是后手已经不太够他打一个超炮之类什么的

  思晓:嗯 一个是这方面的原因,一个可能是对手翻前的一个抵抗。有可能让对手盖到很多大对子,冷扑大师有可能分析到他把对手翻前抵抗的那个范围缩短到很窄很窄,那这个时候也却是很难在这个牌面上盖掉一个很大的对子。

  主持人:我有一个特别搞笑的问题想问一下,冷扑大师你们看他前面几手牌,就从来没有在翻拍,转牌弃掉牌过。永远都是在合牌别人推出来,如果他是bolafu他就是弃掉牌。他为什么在这个转牌的时候,击中了一张4还是不会弃牌还是要平call呢?

  思晓:嗯,首先是说我们看到对手是QQ了。对手如果是翻前抵抗,我觉得不太会抵抗那种太杂的一些手牌,但是也会有一些AQ,JQ、或者AK这种,所以他可能在组合上面,但是我现在算不了太多细节的组合,但是会有一些手对子的组合,但是会miss掉一些JQ 9J类似于这样的组合在上面。

  朱波:不过,如果换过来,人类打这手牌的话,当他下注到4000多的时候,肯定就盖掉了

  思晓:人类肯定就翻前盖掉了。

  朱波:所以这个机器的想法

  开复:但是我们必须假设他是对的,所以表示我们必须要学习,要是我肯定就盖掉了

  朱波:对啊必须要学习 要是这手牌的话,人类的话,我也肯定盖掉了,肯定打都不敢打。

  开复:所以大家学习啊学习。因为范围可能会降低一点,但是也没有低到这个地步。

  主持人:那么这个时候我们看到底池已经到了15400,我们看到了合牌掉了一张黑桃7之后,冷扑大师成了双对儿,

  思晓:我觉这张如果不是黑桃7的话,他合牌一定会下注。我刚才没有想过这个问题,有可能他会打一个极限的价值。但是因为这张是黑桃7,所以对手可能call了黑桃AJ,黑桃AQ,黑桃AK,。因为多了黑桃AJ AQ A9 AK包括A小的这种同色的一个金的可能性,我刚才还在思考他为什么合牌没有下注,因为封锁到了一个首对子,就是因为有了一个金的组合,所以他认为没有更多的保价在里面。这也就更能判断出冷扑大师对这个组合的一个下注的一个比例的精细程度。我觉得是蛮厉害的。

  主持人:所以在合牌黑桃7发出来之后,两方都选择了过牌,开牌

  思晓:对

  主持人:这也是我们看到了四手很精彩的人类和冷扑大师的一个精彩对决。李开复老师也看到这四手牌,您能跟我们介绍一下冷扑大师的打这四手牌的决策的原理么?

  开复:决策的原理就是不断在评估,自己的所有的可能性和对方的所有的回应的可能性。还有下面会发出所有牌的可能性,。就是不断推下去,因为其实一方面我觉得德州扑克的搜索空间是比较小的,因为一共就是这么共有的5张牌加上你的两张手牌,他是可以穷尽的搜索可能性,那他所要做的事情就是平衡人类所有不同的打法和他如何选择一个让人非常两难的空间。就想比如说,我们玩剪刀石头布,如果你用任何的策略去push 1/3 1/3 1/3,那对方就会找到你的弱点。所以这个时候冷扑大师在这个时候就会说好,那剪刀石头布我各1/3。当然这个例子是非常简单的。在这个例子里他就会把各种不同的牌型去判断,当我碰到某种牌型的时候,我应该百分之多少时间这么打,百分之多少时间那么打。那么最后呢,他是最优化对手犯错的可能性和自己得到最多积分码的可能性。

  主持人:我特别想问一下思晓,你刚看了这四手牌之后,你能点评一下人类牌手的一个发挥么?

  思晓:我觉得,首先都有优点,王天健在A8的那一手牌打得很好,他也对机器人做了一个范围的调整。然后包括童舟和张淮他们也之前做的这些都是很标准的。包括张淮拿25做了一些转化。平衡了自己手牌的范围。就把扑克里面重要的概念其实已经传递的不错。

  主持人:那朱波老师刚看了这四手牌,有什么让您匪夷所思的这种牌型么?

  朱波:我觉得匪夷所思的话,机器人在合牌这个领域,这个节骨眼上,明明知道自己落后了,他还继续强行加注,尤其是在turn上打的特别激进,所以在这里面,我感觉人类还是带有情感因素,患得患失,比如像刚刚拿手牌,如果换成人类的话,可能当王天健加注的时候,人类就有可能覆牌了。而冷扑大师反而反加注,所以这个事让我感觉到人类在打牌的过程当中,是不是被情感,可能因为是空军,因为机器是0和1,他是没有恐惧,我要这个结果,要么有要么没有,人呢,就是有灰色地带,灰色地带的话,会不会影响人类在下注筹码时候的忧郁的感觉。这点是不是在1对1 的比赛中,人类几乎很难跟机器有所对抗。

  开复:我觉得可以这么想,冷扑大师呢他可能已经对他的对手的恐惧感已经有一定的把握,。他认为这个对手的恐惧感是比较强的时候,他就会更倾向于选择一个大的下注,因为他打这个出来,虽然有时候会被call会输掉,但是赢的可能会更多。他会有这样的一个判断。

  主持人:朱波老师您之前也组织过私人的比赛,然后这次德扑人机大战,您有没有分析一下技术原理?

  朱波:其实我觉得人机大战呢这个从1对1的角度上来讲,就开复老师讲的,10%也是对人类的一个安慰,其实就是几乎没有胜的可言,其实这里面是对每一个人的分析,就想我今天打完以后,马上就能够学习,明天就是一个专业对付你的人,所以在人类当中呢,我觉得我们在打这种单人的这种比赛呢,我觉得是可能性不大的,未来是不是在多人的比赛中,人类会不会有机会赢

  开复:我觉得会赢,因为今天还没有开发出很好的多人的德扑机器人,但是我觉得这应该有人要做开发,一年之内也应该可以把它衍生出来。

  主持人:还想问一下开复老师,相似技术的应用情景分析。那么人工智能除了打德州扑克,还有下围棋,您觉得以后还能做什么呢?

  开复:哦不是以后了,其实是今天。因为我们已经被人工智能围绕了,你手机里的应用,百度,淘宝,淘宝推荐让你买的东西,滴滴怎么帮你搭车,今日头条怎么帮你排序,知乎怎么让你知道答案,这一切都是背后是人工智能。那除此之外,我觉得最大的机会应该是在金融领域,因为基本上人工智能是一个大数据的游戏,但任何的一个领域,它基本上是一个特别大的数据而且又是可知的结果,对吧,你贷款还了没有,买一只股票他涨了没有,都是非常明确的,所以越明确的这种大数据信息呢越好用。所以金融之外,我觉得还有医疗看片子,然后人脸识别,物体识别,语音识别这个一个个算下来,我觉得大概在十年之内,人类现在所做的50%的工作都会被机器所取代。所以最近呢我也写了一本新书,就叫做人工智能。这本书现在可以开始预购,在里面我描述了人工智能的基本的技术,更总要的讲了他的应用和发展的蓝图。还有作为一个年轻人,要怎么样去选择自己事业的发展才能不会被人工智能机器人所取代。

  主持人:那我刚刚也有回顾今天和昨天比赛的状况,人类在11400手牌里,已经落后了19w多分的差距,然后您能给预测一下接下来的走势么?

  开复:走势应该是越来越不妙,因为机器不断的再学习,人也在学习,因为杜老师每天都会把团队召集起来做练习。然后用各种方法告诉大家试着怎们打,然后学到了什么东西,看来机器学习的速度会更快,所以我会预测差距会越拉越大。但是我觉得就想阿尔法狗对战李世石,李世石最后赢了一局,让我们人类保留了一点尊严,所以我也希望杜悦老师能够在未来的七场中会有一场胜出,还是会有可能的。

  主持人:这么说来,开复老师会认为人类本次胜率的是不足10%哦,我想问一下思晓,你觉得人类的胜率大概会有多少呢?

  思晓:嗯 我不太了解这个整个的东西,但是我觉得我们肯定是占劣势的,然后未来也是会被机器人了解的越来越多。我们的劣势一定会越来越大,我觉得鼓鼓劲吧给他们,希望他们可以更好,因为昨天我有看到他们牌手是有赢单场,我希望未来在单场的比赛中还是可以看到我们牌手的精彩表现。

  主持人:好,作为一个美女牌手,你对这个机器人这个踏进德扑圈的领域你有什么样的感受么?

  思晓:我觉得,我快失业了的那种感觉

  开复:不可能 不可能,我觉得以后打德扑应该是越来越多在线下了,因为线上你没法分辨对手是人还是机器

  思晓:对

  主持人:那么据说4月10号的时候,两位嘉宾会来参加一个表演赛,你们对这个表演赛有什么期待么?

  开复:因为我德扑打的不好,我觉得我就是应该来犯一些很大的错误来让大家嘲笑的。

  思晓:我是为了体验人生,特别感谢开复老师给了这次机会,可能有生之年很早的接触到这些,然后能坚持多久就坚持多久吧。

  主持人:我们今天也谢谢三位嘉宾做客新浪直播间,然后也希望各位观众持续关注我们新浪体育和新浪科技以后的直播,谢谢。

  (文玄)

标签: 李思晓李开复人工智能

相关阅读:

加载中,请稍候...

推荐阅读

加载中,请稍候...