扑克AI对抗人类30年历史 解密冷扑大师前世今生
扑克AI对抗人类30年历史 解密冷扑大师前世今生

  2017年是AI在扑克上取得突破的一年,冷扑大师Libratus和DeepStack相继完胜人类,实现对人类专业级玩家的超越,毫无疑问是里程碑式的突破。在Alp[详情]

新浪综合 | 2017年10月08日 13:07
围棋国手与超级网红驾到 剑指浪体德扑赛冠军
围棋国手与超级网红驾到 剑指浪体德扑赛冠军

  5月6日,浪体德州扑克锦标赛第一期将迎来总决赛阶段的比赛,两位特邀明星牌手将与选拔赛出线的四位牌手争夺本期比赛的冠军。两位特邀牌手,一位是曾经击败过李世石的围棋职业六段高手王垚,一位是德州扑克界集主播、制片、演员等多身份于一身的超级网红色老三。 4月初,冷扑大师与中国龙之队的德州扑克人机对抗表演赛,掀起了一波对人工智能和德州扑克的关注风潮。在这种背景下,“金牌德州扑克”与“新浪体育”合作举办了浪体德州扑克锦标赛,通过海选,决出了四位晋级总决赛的选手,同时新浪体育与金牌德州各自特邀了一位明星牌手,共六位选手参加5月6日在新浪总部大厦演播室直播的总决赛。 围棋圈德州扑克打得最好的人 王垚在德州扑克比赛中 关注围棋新闻的朋友对王垚这个名字并不陌生,别看他的段位只有职业六段,但其实早就有了九段的实力和战绩。早年他不仅是围甲联赛云南队的主力,还经常参加世界大赛,李昌镐和李世石都曾是他的手下败将。没错,就是去年与AlphaGo人机大战的那个李世石。 王垚曾在三星杯中淘汰韩国李世石 这些年王垚出现在围棋赛场上的画面变少,一方面是柯洁等少年棋手成长起来,老棋手们的空间越来越窄,另一方面也是因为王垚对德州扑克发生了浓厚的兴趣,经常去参加一些锦标赛,而且成绩相当不错。 用个比较俗的梗,可以说王垚是下围棋里德扑打的最好的,打德扑里围棋下得最棒的。但据说职业棋手里还有其他的德扑高手,不知道他们服不服王垚这个“围棋圈德扑最强”的名号。 德扑圈的超级网红 著名牌手色老三 色老三在德扑圈里可谓是无人不知,他的经历也很传奇,曾就职于三国杀和暴走漫画,后来自己出来做视频,现在把最爱的德扑和视频结合,成为了集主播、制片、演员等多身份于一身的超级网红 色老三的一些名言也广为流传,例如“鱼打鱼call鱼有点,BuyinN手不眨眼,抢完大盲抢小盲,一言不合All一脸。”同时他最著名的战绩当属,连续一天三把AA四把KK全输。根据运气守恒原理,这次的浪体德扑总决赛,他会不会时来运转呢? 网红的颜值很重要 除了以上两位特邀出战的明星牌手,还有四位从金牌德扑平台选拔赛里脱颖而出的牌手,他们也都不是等闲之辈,这六人将争夺本次比赛的锦标,冠军的奖励是一台Iphone7(第一名:iPhone7,第二名:PS4一台,第三名:beats耳机一部)。以下是四位海选出线牌手的介绍: 吕文: 金牌德州签约牌手兼顾问;多年企业高管履历,德州扑克牌龄8年;2012-2016年作为半职业牌手,MTT及游戏桌均稳定盈利;2015年出任金牌德州战队队长,带队夺得《最强牌手》第二季团队冠军;培训经验丰富,热心细致的辅导入门玩家提高技术水平,成为金牌德州人气最高的主播。 黄文强: 北京奥政投资有限公司总经理。当过四年兵,荣立两次三等功,并光荣加入中国共产党。从事媒体工作数年,编导,主持人,导演。目前从事互联网增值业务开发和运营。 自我介绍:去年年初经朋友介绍,认识并了解金牌德州,从初级玩德州,到获得金牌德州十个冠军的成绩。目前我只要上金牌德州,全国各地的玩家都认识,都尊称我为强哥。我玩德州扑克的体会是,就像打高尔夫一样,每个动作要规范;德州扑克每手底牌和河牌的变化,操作筹码都要规范。学习德州扑克的过程,就是认识自己的过程。 李远龙(龙): 李远龙 来自广东的选手,接触德州两年多,主要打线上的选手,平常接触各个德州平台,都有不错成绩,特别在金牌德州比赛拿过很多个冠军,线下参加过今年年初的澳门MBP拿到21名很不错的成绩,一个很标准的德州新生代玩家。年纪轻轻,同时还是两个小孩的爸爸。 周迅(Andrew): 周迅 男28岁。职业:食品销售渠道部经理。牌龄1年,德州扑克线上比赛新星 半年之内线上锦标赛收获30多个单奖金过万的冠亚军成绩。 5月6日下午14时,新浪演播室,这六位牌手将汇聚在本期浪体德州扑克锦标赛的决赛桌前,谁能笑到最后呢,我们拭目以待。 (白夜)[详情]

新浪体育 | 2017年05月05日 09:10
德扑AI之父:AlphaGo赢不赢柯洁都不缺实际用途
德扑AI之父:AlphaGo赢不赢柯洁都不缺实际用途

  (原标题:德州扑克人工智能之父:赢不赢柯洁,阿尔法狗都缺乏实际用处)人机对战无疑是4月10日的新闻焦点之一。一边在海南澄迈,德州扑克人工智能“冷扑大师”(Lib[详情]

新浪体育 | 2017年04月13日 10:44
视频-重演德扑人机战(四) 张鹏王小山分享畅聊扑克
视频-重演德扑人机战(四) 张鹏王小山分享畅聊扑克

  4月10日,《重演德扑人机大战》节目第四期节目现场,聚众互动CEO张鹏和知名专栏作家、导演、知名牌手王小山做客新浪演播室分享德州扑克人机战花絮。 以上是相关视频。[详情]

新浪体育 | 2017年04月10日 21:52
德扑人机明星体验赛直播回顾 王小山张鹏联手讲解
德扑人机明星体验赛直播回顾 王小山张鹏联手讲解

  4月6日-10日,德扑人机大战名人体验赛在海口举行,6支战队36位名人牌手与德扑AI冷扑大师进行PK,李开复、许戈辉、杨守彬、李思晓等众多大咖出战,新浪为您转播了比赛,欢迎回看。 >>>>>点击回看新浪视频直播 >>>>>点击回看前方直播[详情]

新浪体育 | 2017年04月10日 20:30
高清-德扑名人人机体验赛 王小山张鹏聊德扑AI
高清-德扑名人人机体验赛 王小山张鹏聊德扑AI

  [详情]

新浪体育 | 2017年04月10日 20:03
视频-另类人机战:李开复领衔德扑名人体验赛
视频-另类人机战:李开复领衔德扑名人体验赛

  4月10日下午,为期5天的德扑人机赛在海南闭幕。组委会在闭幕当天的特意安排了彩蛋,李开复、许戈辉等大咖领衔,德扑名人体验赛悄然上演,令本次赛事别有一番风味。 以上是相关视频。[详情]

新浪体育 | 2017年04月10日 19:38
德扑人机大战人类完败 九场全负共输79万分
德扑人机大战人类完败 九场全负共输79万分

  4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。 全部36000手牌打完,人类总共输了792327分,平均每百手损失22个大盲注。这个差距在人类牌手之中已经是比较大的了,一般认为每百手超过10个大盲注的战斗就属于大胜。更令人遗憾的是,即使单算九场比赛,龙之队也没有一场能够在总分上超过冷扑大师。 众所周知德州扑克的胜负与手里拿到的牌直接相关,有很大的运气因素,因此比赛采用了复式发牌,你的手牌好,意味着你的队友手牌坏,计算两人的总分,这样更有说服力。在这样一个相同公平的情况下,是人类牌手组合能够获得更多的积分还是人工智能呢? 虽然总分龙之队落败,但有几次单场比赛的两人小组成绩是胜过冷扑大师的,但出于种种原因考虑,本次比赛并未公布个人成绩,只有总分成绩。 赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。 今天晚上还将有冷扑大师名人体验赛,李开复等跨界名人将挑战冷扑大师,敬请关注新浪之后的报道。 (文玄)[详情]

新浪体育 | 2017年04月10日 11:48
德扑人机第4日冷扑大师小胜 最后一战仍有悬念
德扑人机第4日冷扑大师小胜 最后一战仍有悬念

  4月9日,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了第4日的比赛,上午第七场损失42744分,下午第八场损失55644分,虽然龙之队总分依旧落败,但相比之前几天的成绩大幅好转。10日上午,将进行本次表演赛最后3000手牌的比赛,龙之队能否在单场比赛中击败冷扑大师,依旧存有悬念。 从4月8日下午的第六场开始,龙之队似乎找到了更好地与冷扑大师对抗的策略,虽然总分依然落败,但双方的差距已经大大缩小。在这种背景下,今天大家的心态轻松了许多,延续了好调,两场比赛虽然总分都不敌冷扑大师,这已经是大家取得的第二和第三好的单场战绩了。 有德扑“校长”之称的许朝军坦言在这几天的比赛当中,他学到了很多。这相信也是龙之队整体的感受,可能也是他们这几轮战绩回升的原因之一。帮助人类牌手训练,不断提升自己,这才是人工智能在德州扑克领域未来要扮演的角色。 德扑人机大战龙之队积分情况 积分情况 回到比赛,明天上午将进行最后3000手牌的比赛,虽然总分龙之队已经大幅落后,不太存在整体比赛翻盘的可能,但单场的胜负依旧存有悬念。此前冷扑大师在与四位外国顶尖牌手对抗时,人类牌手也曾一度缩小了比分差距,即取得单场对抗的胜利。再加上这几场比赛龙之队的好调,明天他们能否取得别具意义的一胜呢,我们拭目以待。 (文玄)[详情]

新浪体育 | 2017年04月09日 23:06
视频-重演德扑人机战(三) 颜水成王小山现场PK
视频-重演德扑人机战(三) 颜水成王小山现场PK

  4月9日,《重演德扑人机大战》节目第三期节目现场,360副总裁、首席科学家、人工智能研究院院长颜水成和知名专栏作家、导演,知名牌手王小山做客新浪演播室畅聊德扑人工智能,现场两人模拟单挑。 以上是相关视频。[详情]

新浪体育 | 2017年04月09日 20:34
扑克AI对抗人类30年历史 解密冷扑大师前世今生
扑克AI对抗人类30年历史 解密冷扑大师前世今生

  2017年是AI在扑克上取得突破的一年,冷扑大师Libratus和DeepStack相继完胜人类,实现对人类专业级玩家的超越,毫无疑问是里程碑式的突破。在Alp[详情]

围棋国手与超级网红驾到 剑指浪体德扑赛冠军
围棋国手与超级网红驾到 剑指浪体德扑赛冠军

  5月6日,浪体德州扑克锦标赛第一期将迎来总决赛阶段的比赛,两位特邀明星牌手将与选拔赛出线的四位牌手争夺本期比赛的冠军。两位特邀牌手,一位是曾经击败过李世石的围棋职业六段高手王垚,一位是德州扑克界集主播、制片、演员等多身份于一身的超级网红色老三。 4月初,冷扑大师与中国龙之队的德州扑克人机对抗表演赛,掀起了一波对人工智能和德州扑克的关注风潮。在这种背景下,“金牌德州扑克”与“新浪体育”合作举办了浪体德州扑克锦标赛,通过海选,决出了四位晋级总决赛的选手,同时新浪体育与金牌德州各自特邀了一位明星牌手,共六位选手参加5月6日在新浪总部大厦演播室直播的总决赛。 围棋圈德州扑克打得最好的人 王垚在德州扑克比赛中 关注围棋新闻的朋友对王垚这个名字并不陌生,别看他的段位只有职业六段,但其实早就有了九段的实力和战绩。早年他不仅是围甲联赛云南队的主力,还经常参加世界大赛,李昌镐和李世石都曾是他的手下败将。没错,就是去年与AlphaGo人机大战的那个李世石。 王垚曾在三星杯中淘汰韩国李世石 这些年王垚出现在围棋赛场上的画面变少,一方面是柯洁等少年棋手成长起来,老棋手们的空间越来越窄,另一方面也是因为王垚对德州扑克发生了浓厚的兴趣,经常去参加一些锦标赛,而且成绩相当不错。 用个比较俗的梗,可以说王垚是下围棋里德扑打的最好的,打德扑里围棋下得最棒的。但据说职业棋手里还有其他的德扑高手,不知道他们服不服王垚这个“围棋圈德扑最强”的名号。 德扑圈的超级网红 著名牌手色老三 色老三在德扑圈里可谓是无人不知,他的经历也很传奇,曾就职于三国杀和暴走漫画,后来自己出来做视频,现在把最爱的德扑和视频结合,成为了集主播、制片、演员等多身份于一身的超级网红 色老三的一些名言也广为流传,例如“鱼打鱼call鱼有点,BuyinN手不眨眼,抢完大盲抢小盲,一言不合All一脸。”同时他最著名的战绩当属,连续一天三把AA四把KK全输。根据运气守恒原理,这次的浪体德扑总决赛,他会不会时来运转呢? 网红的颜值很重要 除了以上两位特邀出战的明星牌手,还有四位从金牌德扑平台选拔赛里脱颖而出的牌手,他们也都不是等闲之辈,这六人将争夺本次比赛的锦标,冠军的奖励是一台Iphone7(第一名:iPhone7,第二名:PS4一台,第三名:beats耳机一部)。以下是四位海选出线牌手的介绍: 吕文: 金牌德州签约牌手兼顾问;多年企业高管履历,德州扑克牌龄8年;2012-2016年作为半职业牌手,MTT及游戏桌均稳定盈利;2015年出任金牌德州战队队长,带队夺得《最强牌手》第二季团队冠军;培训经验丰富,热心细致的辅导入门玩家提高技术水平,成为金牌德州人气最高的主播。 黄文强: 北京奥政投资有限公司总经理。当过四年兵,荣立两次三等功,并光荣加入中国共产党。从事媒体工作数年,编导,主持人,导演。目前从事互联网增值业务开发和运营。 自我介绍:去年年初经朋友介绍,认识并了解金牌德州,从初级玩德州,到获得金牌德州十个冠军的成绩。目前我只要上金牌德州,全国各地的玩家都认识,都尊称我为强哥。我玩德州扑克的体会是,就像打高尔夫一样,每个动作要规范;德州扑克每手底牌和河牌的变化,操作筹码都要规范。学习德州扑克的过程,就是认识自己的过程。 李远龙(龙): 李远龙 来自广东的选手,接触德州两年多,主要打线上的选手,平常接触各个德州平台,都有不错成绩,特别在金牌德州比赛拿过很多个冠军,线下参加过今年年初的澳门MBP拿到21名很不错的成绩,一个很标准的德州新生代玩家。年纪轻轻,同时还是两个小孩的爸爸。 周迅(Andrew): 周迅 男28岁。职业:食品销售渠道部经理。牌龄1年,德州扑克线上比赛新星 半年之内线上锦标赛收获30多个单奖金过万的冠亚军成绩。 5月6日下午14时,新浪演播室,这六位牌手将汇聚在本期浪体德州扑克锦标赛的决赛桌前,谁能笑到最后呢,我们拭目以待。 (白夜)[详情]

德扑AI之父:AlphaGo赢不赢柯洁都不缺实际用途
德扑AI之父:AlphaGo赢不赢柯洁都不缺实际用途

  (原标题:德州扑克人工智能之父:赢不赢柯洁,阿尔法狗都缺乏实际用处)人机对战无疑是4月10日的新闻焦点之一。一边在海南澄迈,德州扑克人工智能“冷扑大师”(Lib[详情]

视频-重演德扑人机战(四) 张鹏王小山分享畅聊扑克
视频-重演德扑人机战(四) 张鹏王小山分享畅聊扑克

  4月10日,《重演德扑人机大战》节目第四期节目现场,聚众互动CEO张鹏和知名专栏作家、导演、知名牌手王小山做客新浪演播室分享德州扑克人机战花絮。 以上是相关视频。[详情]

德扑人机明星体验赛直播回顾 王小山张鹏联手讲解
德扑人机明星体验赛直播回顾 王小山张鹏联手讲解

  4月6日-10日,德扑人机大战名人体验赛在海口举行,6支战队36位名人牌手与德扑AI冷扑大师进行PK,李开复、许戈辉、杨守彬、李思晓等众多大咖出战,新浪为您转播了比赛,欢迎回看。 >>>>>点击回看新浪视频直播 >>>>>点击回看前方直播[详情]

高清-德扑名人人机体验赛 王小山张鹏聊德扑AI
高清-德扑名人人机体验赛 王小山张鹏聊德扑AI

  [详情]

视频-另类人机战:李开复领衔德扑名人体验赛
视频-另类人机战:李开复领衔德扑名人体验赛

  4月10日下午,为期5天的德扑人机赛在海南闭幕。组委会在闭幕当天的特意安排了彩蛋,李开复、许戈辉等大咖领衔,德扑名人体验赛悄然上演,令本次赛事别有一番风味。 以上是相关视频。[详情]

德扑人机大战人类完败 九场全负共输79万分
德扑人机大战人类完败 九场全负共输79万分

  4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。 全部36000手牌打完,人类总共输了792327分,平均每百手损失22个大盲注。这个差距在人类牌手之中已经是比较大的了,一般认为每百手超过10个大盲注的战斗就属于大胜。更令人遗憾的是,即使单算九场比赛,龙之队也没有一场能够在总分上超过冷扑大师。 众所周知德州扑克的胜负与手里拿到的牌直接相关,有很大的运气因素,因此比赛采用了复式发牌,你的手牌好,意味着你的队友手牌坏,计算两人的总分,这样更有说服力。在这样一个相同公平的情况下,是人类牌手组合能够获得更多的积分还是人工智能呢? 虽然总分龙之队落败,但有几次单场比赛的两人小组成绩是胜过冷扑大师的,但出于种种原因考虑,本次比赛并未公布个人成绩,只有总分成绩。 赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。 今天晚上还将有冷扑大师名人体验赛,李开复等跨界名人将挑战冷扑大师,敬请关注新浪之后的报道。 (文玄)[详情]

德扑人机第4日冷扑大师小胜 最后一战仍有悬念
德扑人机第4日冷扑大师小胜 最后一战仍有悬念

  4月9日,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了第4日的比赛,上午第七场损失42744分,下午第八场损失55644分,虽然龙之队总分依旧落败,但相比之前几天的成绩大幅好转。10日上午,将进行本次表演赛最后3000手牌的比赛,龙之队能否在单场比赛中击败冷扑大师,依旧存有悬念。 从4月8日下午的第六场开始,龙之队似乎找到了更好地与冷扑大师对抗的策略,虽然总分依然落败,但双方的差距已经大大缩小。在这种背景下,今天大家的心态轻松了许多,延续了好调,两场比赛虽然总分都不敌冷扑大师,这已经是大家取得的第二和第三好的单场战绩了。 有德扑“校长”之称的许朝军坦言在这几天的比赛当中,他学到了很多。这相信也是龙之队整体的感受,可能也是他们这几轮战绩回升的原因之一。帮助人类牌手训练,不断提升自己,这才是人工智能在德州扑克领域未来要扮演的角色。 德扑人机大战龙之队积分情况 积分情况 回到比赛,明天上午将进行最后3000手牌的比赛,虽然总分龙之队已经大幅落后,不太存在整体比赛翻盘的可能,但单场的胜负依旧存有悬念。此前冷扑大师在与四位外国顶尖牌手对抗时,人类牌手也曾一度缩小了比分差距,即取得单场对抗的胜利。再加上这几场比赛龙之队的好调,明天他们能否取得别具意义的一胜呢,我们拭目以待。 (文玄)[详情]

视频-重演德扑人机战(三) 颜水成王小山现场PK
视频-重演德扑人机战(三) 颜水成王小山现场PK

  4月9日,《重演德扑人机大战》节目第三期节目现场,360副总裁、首席科学家、人工智能研究院院长颜水成和知名专栏作家、导演,知名牌手王小山做客新浪演播室畅聊德扑人工智能,现场两人模拟单挑。 以上是相关视频。[详情]

高清-重演德扑人机战节目 颜水成王小山畅谈比赛
高清-重演德扑人机战节目 颜水成王小山畅谈比赛

  [详情]

德扑人机进入收官龙之队再取佳绩 李开复观战
德扑人机进入收官龙之队再取佳绩 李开复观战

  4月9日,冷扑大师VS中国龙之队德州扑克人机大战表演赛进入到收官阶段,在上午进行的第七场对决中,龙之队虽然以53907的积分劣势落败,但这已经是他们本次比赛的第二好成绩,人类牌手似乎渐渐熟悉了AI的打法,有了一些还手之力。 受日程的影响,第七场比赛的总共手牌数增加到了4800,所以龙之队全部选手比赛结束得很晚。按说这样对体能的要求会更加苛刻,但龙之队本场的总成绩比起以前再度有所进步,虽然六位牌手总分仍然输了53907分,但这已经是七场比赛以来的第二好成绩。 以下是详细积分情况。 七轮后积分 下午,比赛的发起人、创新工场的李开复也来到赛场,体验与冷扑大师的对抗。明天下午,以李开复为首的创投、科技、娱乐界各路人马将组成六支战队,分别与冷扑大师一较长短。 李开复与冷扑大师之父托马斯教授 (文玄)[详情]

视频-德扑美女牌手:比赛很好玩 AI也犯愚蠢错误
视频-德扑美女牌手:比赛很好玩 AI也犯愚蠢错误

  德扑人机大战比赛日赛后,美女牌手朱亚希分享了一些比赛中的趣事,她表示AI有时会犯一些人类看起来有些愚蠢的有趣错误。 以上为相关视频。[详情]

视频-专访冷扑大师之父:AI难胜 人类仅能力争少输
视频-专访冷扑大师之父:AI难胜 人类仅能力争少输

  德扑人机大战间隙,新浪体育对“冷扑大师”之父、卡耐基梅隆大学的计算机科学家Tuomas Sandholm教授进行了独家专访。教授表示,结合近日的比赛来看,AI在人类棋手面前展现出了难以战胜的特质,而人类棋手能够争取的看来只有尽量少输了。 以上为相关视频。[详情]

视频- 德扑人机战选手:AI冷酷无情不上头
视频- 德扑人机战选手:AI冷酷无情不上头

  德扑人机大战比赛日赛后,龙之队队长杜悦表示AI跟人类棋手在博弈上没有表现出明显的差异,关键点在于AI没有情绪的变化,不会有所谓“上头”的表现。 以上为相关视频。[详情]

视频-聚焦德扑人机大战 AI狂胜不止
视频-聚焦德扑人机大战 AI狂胜不止

  德扑人机大战在海南海口激战正酣,从首个比赛日开始至今,AI展现出了强大的优势,作为人类代表出战的中国龙之队目前颓势明显。 以上为相关视频。[详情]

鬼知道德扑圈这几天经历了什么 神之一手要来了
鬼知道德扑圈这几天经历了什么 神之一手要来了

  相比去年李世石与AlphaGo的人机大战给围棋圈带来天翻地覆的冲击,德扑圈此前对失利是有着足够的心理预期的,毕竟冷扑大师在此前的比赛中已经击败过四位顶尖的外国德扑职业选手。龙之队出战的六位牌手虽然也都实力不凡,甚至有的还是程序员出身,但在技术上他们恐怕也不敢说比那四位外国牌手更强。 虽然已经提前做好了输的心理准备,但当强大的冷扑大师真切地出现在大家面前,坐到牌桌对面的时候,给中国德扑人的震惊,远比想象大得多的多。 有中国德扑教父之称的王天健,在某天比赛结束后,神色憔悴地跟队友说道:“打牌这么多年,从来没有给人这样在地上锤过……” 司文是这次德扑人机大战的直播主持:“铜墙铁壁!我们直播这么多年,没见到过这么强大的……” 冷扑大师的强悍在于,即使龙之队的牌手某位牌手能够在单场比赛中取胜,它也不会输很多积分;而对面的拿着镜像手牌的队友,往往被打得惨败。这也是为什么昨晚,童舟、许朝军两位同组队友同时取胜,他们那么兴奋的原因。这是在单场对决中,龙之队第一次战胜冷扑大师。 朱亚希心情不错 由于德州扑克比赛的特殊性和运气成分,这一场胜利并不能说明太多问题,真正有说服力的数据还是全队六位牌手的总分和全程比赛的成绩。但这并不影响龙之队牌手们重拾信心,9日的赛场上,大家的神情明显轻松了许多。 虽然人类总成绩已经落后很多,但在单场比赛中真正扳回一局似乎迎来了新的希望,也许如人机大战第四局李世石般的“神之一手”要来了。 (周游)[详情]

高清-德扑人机大战第4日 龙之队牌手神态轻松
高清-德扑人机大战第4日 龙之队牌手神态轻松

  [详情]

视频-重演德扑人机大战二 李竹李思晓畅谈比赛
视频-重演德扑人机大战二 李竹李思晓畅谈比赛

  4月8日,重演德州扑克人机大战节目第二集继续进行,中国青年天使会会长、英诺基金创始人李竹,中国首位夺得德州扑克亚洲冠军的女牌手李思晓做客新浪演播室,点评比赛精彩瞬间。 以上是相关视频。[详情]

白话AI:人工智能会诈唬其实是个数学问题
白话AI:人工智能会诈唬其实是个数学问题

  柏林森,资深计算机行业从业者,深度围棋、德州扑克爱好者。此次以新浪棋牌特约评论员的身份和我们一起关注德州扑克人机大战。我们精选了一些小白问题(其实就是小编自己想不明白的)来请教柏老师,制作了《白话AI》的栏目。 问:听说人工智能会诈唬,它们学会骗人了?! 答:所谓诈唬就是在德州扑克比赛里,假装自己有大牌,把对方吓跑。我们忘掉诈唬这个词的表面意思,它其实就是德州扑克里的一个技术手段。除了诈唬,还有假装诈唬,假装假装诈唬,甚至一直无限的假装下去。 从数学的角度上讲,诈唬是在德州扑克游戏里获得更大收益的一种基础手段,只是在表现形式上看似是在“骗人”而已。对AI来说,诈唬和说实话没有本质的区别,只是在当前牌型和底池情况下,选择哪种策略会让它的长期收益更高而已。 冷扑大师会用诈唬的策略不是人为教给它的,而是告诉它德州扑克规则之后,它在演算过程当中自然而然形成的打牌策略,是这个游戏规则本身决定的。对人工智能来说,德州扑克是个数学问题,诈唬这种行为和加减乘除的之类数学符号没什么区别。 柏老师跟教授下了盘围棋 今天柏老师专访了冷扑大师的缔造者托马斯教授,两人谈笑风生,相见恨晚,还下了一盘围棋。柏老师问了教授很多关键性的问题,比如冷扑大师是否每天都会把与龙之队比赛的牌谱拿回去研究升级,对此,教授回答:“暂时无可奉告,等比赛结束才会公布这些技术细节”。 (文玄)[详情]

比赛地点惊讶媒体 冷扑开发者:海南咋就不能搞AI
比赛地点惊讶媒体 冷扑开发者:海南咋就不能搞AI

  没太大悬念,人族代表龙之队的劣势扩大了。 截止到北京时间22:00时,冷扑大师VS中国龙之队巅峰表现赛DAY2经过11小时的战斗中国龙之队完成8400手牌。 上半场比赛,冷扑大师保持着首日的稳健表现,领先186842记分牌。下半场比赛,冷扑大师依旧领先中国龙之队,赢得160723记分牌,DAY2冷扑大师领先347565记分牌。经过两天的比拼冷扑大师共领先412792记分牌。 不过,比赛不只有结果的胜负,还有现场有趣的观点被谈及。在德扑人机大战的前方现场第二日,新浪科技采访到了冷扑大师开发者Tuomas Sandholm教授,以及几位龙之队的队员。 1 德扑人机大战地点定在海南,让不少媒体有所惊讶。 一直以来,海南并不以互联网发展著称,所以当比赛第一日网络遇到问题重启超级计算机,以及第二日因为网络登入有延迟时,已经来到现场督战的Tuomas Sandholm教授被问到了“远程协作”的问题。 Tuomas Sandholm 是CMU的教授,是“冷扑大师”之父,他于4月6日抵达海南,而且也是他的第一次海南之旅,此前他只听说这是一个可以称作“中国夏威夷”的地方。 Tuomas Sandholm当然不认为距离和地点能给冷扑大师带来挑战。 即便首日和次日接连遇到了网络相关的问题,但Tuomas Sandholm在接受新浪科技前方采访时,还是直截了当地表示:距离不是问题,在匹兹堡、在北京、在海南,对于冷扑大师来说都一样,而且即便在冷扑大师 “老家”匹兹堡比赛,具体真正的超算机房,也有30公里的距离。 Tuomas Sandholm解释了网络问题的真实原因——适配调整还未完美,不过就在接受采访时,次日上午的比赛已经接近尾声,网络再没遭遇挑战,而且冷扑大师的状态似乎越来越好了。 2 冷扑大师的状态更好了。这话不是别人瞎猜的,这话是龙之队队员许朝军说的。 他是这场巅峰表演赛中的“急先锋”,比赛开打以来,他总是第一个完赛的选手,还是其中成绩不错的选手。在第一日和第二日的4场比赛中,他有2场以上击败了冷扑大师。不过,由于此次采用的是团体计分的规则,个人选手的成绩并不希望被透露太多。 然而,新浪科技还是得到了一些确切且振奋的消息。比如在第一日的比赛中,许朝军2场比赛都击败了冷扑大师,用德扑专业术语来说是“在水上”。许朝军将此归结为之前准备工作充分,确实针对性的措施有了效果。 但在第二日上午比赛结束后,让许朝军感叹的是:冷扑大师似乎调整了策略,变强了,而且好像有了“读心术”,第二天的比赛超级难打。 Tuomas Sandholm教授证实了许朝军的感觉,他表示冷扑大师之所以可以用人工智能来定义,完全就是这种机器学习和不断优化的能力,在这方面人类的劣势显而易见。 作为这支龙之队的体能教练,许朝军透露在准备的一个多月里,龙之队从健身训练到头脑风暴,都在为这次人机大战做准备,所以当第一日“小输”惜败之后,他们备受鼓舞,但第二日展现出的实力来讲,似乎冷扑大师在一夜之间又提升了。 3 值得注意的是,这并非人工智能“遇强则强”。现场有媒体问Tuomas Sandholm说,如果完全不懂德扑、或者小白用户和冷扑大师对战,会不会出现“乱拳打死老师傅”的情况,在怪招之下把人工智能打懵? 在回答冷扑大师是否会被打懵之前,Tuomas Sandholm教授显然被这个问题问懵了,他可能不太理解这个问题的内在逻辑,所以又向翻译确认重复了几回。 在中国,正如“乱拳打死老师傅”成语存在一样,不少人仍旧认为所有的人工智能都会存在bug,而这个bug可能防高手而不防小白,正如不会下棋的虚竹破了珍珑棋局一样,如果乱打一气,是不是会让机器搞不清楚状况而陷入“死机”? Tuomas Sandholm教授否认了这种情况的出现,他表示冷扑大师终极所在是数学原理,是概率思维,冷扑大师的目标就是通过价值网络去“赢”下比赛,而不管是高手小白,对冷扑大师的区别可能是“计算量”的差别而已。 Tuomas Sandholm还谈到,之所以可以这么去解释,是冷扑大师采用的算法是可回溯可检查的,这与AlphaGo所使用的深度学习的算法模型还有所区别。 自被李世石的神之一手击穿至今,AlphaGo团队始终未能找到机器忽然“懵逼”的原因所在。实际上,深度神经网络的 黑箱问题一直备受关注,但至今仍旧不能完全解决。虽然有Google资深工程师向新浪科技透露过,AlphaGo的算法程序有多种组成,并非只有深度学习 一种,但一年后DeepMind团队还是没找到出题出现的原因。 这也是Tuomas Sandholm被问到“冷扑大师”和AlphaGo谁更厉害时谈到的观点。他认为这二者无法直接比较,也无法通过比赛一较高下,因为二者所使用的方法和要研究的问题截然不同。 AlphaGo使用深度学习算法模型为主,主打有限信息条件下的计算,只要范围确定,AlphaGo就能展现出威力。 冷扑大师则针对“不完整信息博弈”,比如谈判等大量信息被隐藏的领域,是冷扑大师团队想要利用机器解决的问题。 而且发展到现在,Tuomas Sandholm认为冷扑已经到了要进入商用应用的阶段。他这次不仅代表研发团队和自己的科研弟子来华,Tuomas Sandholm还代表自己创立的公司“Strategic Machine”,他表示在不久,这家公司就会把冷扑大师带入商业谈判、网络安全、医疗方案制定等领域,并且坚信会比人类做得更优秀。 4 值得一提的是,Tuomas Sandholm强调说,这种应用还将是全球性的,不限制地域和条件的——或者说只要接入了互联网即可。 这也是德扑人机大战可以选在海南进行的原因。一方面是冷扑大师对“出差”完全不存在技术问题,另一方面则是海南当地对此次活动寄予厚望,希望把目前基础设施和诚意最大化展示,以期未来更多互联网创业者来到海南开展自己的项目。 在舆论热议的雾霾等环境问题探讨中,海南的优势更加明显:环境优美、沙滩阳光比基尼…… 有意思的是,Tuomas Sandholm在得知最后比赛地点可以定在海南时,高兴地回复李开复:这么说,我可以带上我的泳裤了?![详情]

高清-德扑人机大战进入第3日 德扑女神专心致志
高清-德扑人机大战进入第3日 德扑女神专心致志

  [详情]

李开复:人工智能自我调整厉害 李思晓:AI包容性强
李开复:人工智能自我调整厉害 李思晓:AI包容性强

  4月6日-10日,德州扑克人机大战在海南火热进行。7日,创新工场CEO和著名美女牌手李思晓做客新浪演播间,与主持人回顾了人机大战前2日的赛况。 主持人:我现在有请李开复老师介绍这次活动背景 开复:我们可能都关看到今年一月美国CMU卡耐基梅隆大学的一位教授,开发了一套德扑的机器人,而且在美国打败了顶尖的美国高手。因为我自己也是卡耐基梅隆毕业的,所以我就对他发出邀请。看他愿不愿意来跟中国的牌手对抗一下,那么就想阿尔法狗打败了世界冠军在围棋上,那么CMU的这套冷扑大师系统在美国打败了顶尖高手。那这次来到中国,我们是抱着希望,让大家能够看到德扑也是可以有意思的比赛。而且比围棋更有不同的意义。那么也非常开心的是,托马斯教授也带着冷扑大师过来,和我们这次组织的中国龙之队是由杜悦老师,是中国唯一的在VSOP上得过金手链的,带着中国龙之队的六位选手跟冷扑大师做一个为期五天的对抗,这是一个大概的背景。 主持人:好,那么我们先来看一下这两天的赛况 4月7日上午,冷扑大师对战中国龙之队德州扑克人机大站表演赛在海南生态软件园传奇智力运动馆结束了第三场比赛,本场六位选手共与冷扑大师打了近4200手牌,共输了124654分,加上昨天的损失,人类在11400手牌里已经落后了191591分。双方的差距也是越来越大了。所以我想问一下在场的三位嘉宾,昨天也有一直在关注这个比赛吧,然后你们对于昨天和今天的表现有什么评价呢? 开复:我先来说一下哈,一共有三场比赛嚒,第一次人类是输了一万多分,第二次是五万多分,第三次是十二万多分,这其中是有他的道理的,第一个我们可以看到,一万多分基本是一个不相上下的情况,表示中国龙之队确实很强,但是呢,冷扑大师他没打完一次比赛以后呢,一个小节之后,他就会开始机器学习,针对每一位牌手,针对他们所有的弱点,他会调整自己的参数,所以在第二次,第一天下午的比赛,他就已经化身成了六个冷扑大师,针对每一位牌手的弱点调整了自己的参数,呐,他就从一万赢到了五万。第三场,再学习之后就到了十二万。所以我们可以看到机器的自我调整是非常厉害,非常可怕的。 主持人:呐 李思晓呢? 李思晓:首先呢我觉得,嗯 这次很有看点,然后因为我不太了解机器,开复老师可能更了解,但是我会觉得比较可怕,我看了之前的一些介绍,包括他不单纯只是从大数据上的一个归纳,而且对人的及时的调整和很多整个德州扑克上的一些专业的学习能力是非常强的机器,因为这一次也是非常有看点,这六位牌手也是代表了中国最顶尖的一个水平,第二我昨天也看了一下,六位牌手所代表的风格也是不一样的,每个人对同样的一首牌的打法是完全不一样的一个处理方式,然后机器对人的一个及时调整也是很快速,你就可以看到他的包容性会是很强的,因为对于完全不同的六种风格的玩家有一个判断,这个还是很厉害的。当然我觉得,从第一场来说,我们人类牌手也有一些非常优秀的地方。 主持人:好了,我觉得现在应该还有很多观众会就是很疑问这个冷扑大师是一个什么样的存在,所以我特别想问一下开复老师冷扑大师这个电脑程序他是怎么学会打德州扑克的呢? 开复:其实这个跟阿尔法狗的围棋差别挺大的,因为冷扑大师从来没有学过人的比赛的牌谱,阿尔法狗是先从人的牌谱学起,然后在自我提升,冷扑大师几乎是从博弈论的理论加上德州扑克的规矩自己再不断的推进他的算法,所以他每一次决定的下注或者是不下注,或者每一个决策,他是针对所有人类的可能性然后所有的这种诈和和当真的可能性,做一个对他最有利的判断。那么这个判断呢,下出来以后,无论人是怎么样的回应,他应该都是一个接近最优的,然后他是优化自己的打法,让对手猜不出来自己是用什么风格在做什么事情。而他呢又会去猜,对方是用什么方式,呐,如果你把这个盖子掀开来,它里面其实是一个特别巨大的数据库,他储存了所有牌的排列与组合,还有在这种排列组合之下如何去找到一个平衡点,让对方猜不出来你有什么牌,所以还是一个巨大的统计系统。 主持:那我想问一下冷扑大师这个存在是否就意味着人工智能会向人类隐瞒信息呢? 开复:应该是说他的表现是有在隐瞒信息。但是呢,这是人教他去隐瞒的。就是说,现在所有的人工智能的工具无论是机器人、无人驾驶、阿尔法狗或者冷扑大师,他都是人写的代码,人操控的工具,所以他是我们管的,他没有自我意识来去隐瞒信息,他的隐瞒信息他的编程者叫他去隐瞒信息的,所以不用太担心我们的机器人以后会来欺骗我们。 朱波:其实这里面有一个人工智能的话在一些完全不确定的状况当中,信息不完全清楚的情况下能够做出他自己的最佳判断,这个呢我觉得人工智能能够在德扑做到这个地步的话,其实他的,应该说他的不确定信息,这种架势可能还有更多一点。 开复:我们可能跟围棋做一个对比的话,围棋它的每一个黑白棋都在你的面上,俩人都知道,没有任何隐藏的,那真是的应用在什么地方?人的真实的应用很少是一切都暴露出来的,那么德扑更像,比如你买一套房子,他是900w 你的心里价位是850w,你是先开出700w再加呢?还是开出840w说我再也不加了,他的这个商业的交谈,谈生意的过程其实就跟德扑是很像的。所以这也意味着德扑能够克服,以后商业谈判啦政治外交啦,国际关系啦,都可能有机器来帮助人,所以把这个应用层面提升的高。 主持人:好的,那我们昨天和今天上午也看到了很多精彩牌局,那我们来给观众来模拟一下。 第一手牌是alen是坐在小盲芒位,拿了一个草花4草花10,冷扑大师就是拿了一个草花25,就在大盲位。好我们看一下现在这手牌,这边是冷扑大师,那边是alen,然后一个是小盲,一个是大盲。他们在翻牌前,alen是加注到230 思晓:对,alen是加注到230左右,一个2.3BB的一个标准的加注 主持人:对,冷扑大师是平call,平call 130 思晓:冷扑大师选择了一个抵抗,因为在单挑里面,这个2 5的草花,只是有一个同色,还是可以选,因为只加1点多的1个DB,还是去进行一个抵抗。然后我看到底牌是一个A 6 10 的一个彩虹的情况,双方的玩家都选择了过牌,在人类这边的一个看法,可能是中了一个中队,然后选择了一个延迟性下注,同时因为我在观察这个冷扑大师的这个打法里面,他经常性的在转牌和合牌在做一些的很超池的一些下注,所以人类基本上在做这种中等牌类的时候会做些严格的控池的情况,冷扑大师很有意思,因为你在正常来说,你跟人类去打在前位回去控池,在后位回去造池,我昨天看冷扑大师经常会做一些匪夷所思的下注和判断,所以人类在这时候想做一个过牌同时引导对手去有一个咋呼的情况。 开复:其实冷扑大师他是在平衡不同的打法。他只可能一部分像人的打法,一部分像非人的打法。这样更让你猜不透,如果全部非人了你可能也会打得过他。 思晓:所以是心理上换成是我,因为我不了解那六位玩家,我可能会有一些恐惧 朱波:现在这手牌是昨天第一天的牌是吧? 思晓:对 我们现在复盘一个牌,同样的一手牌,然后人和冷扑大师交叉对打。然后造成的一个不一样的情况。 主持人:我来看一下,第一次底牌后,双方都过牌了。然后底牌又发了一张黑桃3。黑他3出来之后,冷扑大师选择的是下注1911。Alan选择下注到4000 思晓:我现在扮演的是一个人类 开复:你扮演的是人类?我以为你人类,你来自外星哦? 思晓:对 alan现在选择下注到4000,我们给冷扑大师转牌是一张好牌,给了一张补拍,有金有顺的一个层面,基本上是有12-13张的补牌。然后在这个牌面上,尤其是人类有可能是不中,没有任何的关系,所以,差不多是有30%-40%的胜率。所以冷扑大师选择了一个超池的一个下注,你可以看到我刚说的他会有一些很,在一个460的一个底池下面,下了一个将近5倍的一个底池性的下注 主持人:因为这个发射器上调出来一张。 思晓:一个是给他自己一个比较好的补牌,同时他可以偷掉对手一个没有任何A的一些补牌,就可以说,因为人类选择了过牌,所以人类有A的可能性,当然我们看到结果却是没有A,有A的可能性也确实没有那么大。那可以打掉对手的JJQQ,或者是KK 这些左右牌,所以冷扑大师选择了一个4倍的底池,会有更多的弃牌率在扑克的数学上面 主持人:那么alan跟注到了4000又是一个什么意思? 思晓:Alan跟注到了4000,杜悦老师之前我看他打WSOP时,我看他有一些在转牌上很激进的处理方法,他可能也读到了冷扑大师有可能是一个没有牌在转咋呼的一个情况。所以他做了一个反加注的转咋呼。而没想到冷扑大师选择了跟注。而且杜悦老师比较好,他有一张10 ,是一个对儿的补牌,他这里更多的是扮演一个A 10 或者一个对10的这样的一个范围。 朱波:是不是Alan这个跟注也是在验这个冷扑大师到底这个牌是不是他真的是成牌,如果是在买牌路上的也有可能就走了。 思晓:对,一个是转咋呼,同时也是试探对手的一个下注。 主持人:alan跟注到4000之后,冷扑大师选择了call 齐。然后我们来看合牌掉了一张红桃5,之后 思晓:我们从减法上来看这个是人类是领衔的 主持人: 这个是冷扑大师率先带的2197之后alan选择了复牌。 思晓:这个有点意思哈,换我我可能会call,但是因为转牌的这个加注,然后封锁掉了很多范围,因为在杜悦老师看来,对手不太会去偷底池。所以在杜悦老师看来,对手他的10可能会挂一个比较小的踢脚,有可能是落后了。但是在底池赔率上来说,可能是有10可以去开的,但是因为转牌这样一个反加注的过程,会锁紧一些范围。 朱波:是不是杜悦老师在考虑他可能是顺?因为这个牌是花顺双出么,翻到5出来这个胜面就很大。 思晓:因为牌面还是比较湿润的在扑克里面。然后牌在前位先做了一个。因为他觉得他自己是肯定赢不了了么, 主持人:在底牌后双方都选择check的情况下在10上冷扑大师做了一个open,然后他做了一个跟注之后冷扑大师又继续平call了,然后再合牌掉了一张5之后,冷扑大师继续开枪了。所以alan就选择了覆牌。这个思路是alan觉得冷扑大师成顺了是么? 思晓:嗯……我觉得alan会觉得冷扑大师有A吧。成顺的可能性并没有那么大。嗯……转牌成顺只有47的一手牌,但是有A 的组合,A 6 A10的组合,包括或者A3 的组合可能会更多一些,而且冷扑大师觉得对手是没有A的。但是这个合牌的下注有点意思。因为这只是单独的一手牌,因为可能他之前了解对手的一个数据,尤其对对手的转牌,我觉得这个牌重点不在合牌,重点是在转牌,一个强行的call的一个跟注。去读到对手一个范围,一个没有顶端的范围。这个是重点。 主持人:我们来看一下,迹象反过来的时候,我们张淮拿了冷扑大师的这手牌。张淮拿了黑桃25,冷扑大师拿了草花10 4 。他们俩是怎么对决的呢?冷不大师依然在大盲位。然后这个时候在翻牌前,冷扑大师加注到了250,然后张淮跟到600, 思晓:看到人类很激进啊,看到处理这些手牌。 主持人:冷扑大师平call 350,call 齐。这时候我们看一下底牌,底牌发出来 6 10 A的时候,张淮是率先加到800,就底池在1200的时候,张淮加注800。然后冷扑大师选择了平Call 800。这个时候你觉得,他们的思路是? 思晓:首先这个人类的这个翻前反加注很激进啊。可能这个之前也是为了平衡自己的手牌吧。因为冷扑大师太强了,如果我们打的很传统的话,可能就更有劣势。所以可能也会要用一些这种比较极化,我们叫两极牌,比如25这种,代表一些比较强的一些范围。尤其这个翻牌发出来以后,我们看到自己是25,因为我们翻前一些强势的举动,所以我们会代表我们自己手里有A,或者有A的一些组合,或者持续性下注,所以这里是一个很标准的持续性下注。 主持人:所以张淮加注到了800,所以冷扑大师选择了平call,然后我们看底牌掉了一张黑桃3之后,张淮是继续下注2000, 思晓:跟刚才拿手牌是一样的么?就是同样是有一个比较好的发展。然后我们又表现的强势,所以我们在这里一个是去塑造这样一个底池,同时看看打对手的一个弃牌率。在这点上打对手的一个弃牌率,冷扑大师做的是一个4倍的底池加注,我们做的是一个不到4/5的一个底池的下注。所以你就能看出冷扑大师对对手的一个弃牌率的处理上,在数学上更精准更凶狠一些。如果觉得对手没有A,他会更激进。 开复:因为他的每一次的动作的搜索的范围都是无限的,他可以从下100一直call in,他会考虑每一个可能性。然后找到其中的那一个可能性,是可以让他,无论在对手的回应之下,得到平均最大化的回报。 思晓:对 朱波:所以他是不是在底池2800的时候加注4/5还是带有邀请性的。想打出价值来。 思晓:对,这叫双向型下注,这就叫半咋呼,就算对手跟注了我们,合牌也可能也有十几张的补牌。但冷扑大师可能更直接 朱波:冷扑大师就是我要赢这手牌,我把你吓唬走了。他这里的话更想能够打出价值来 思晓:这可能就是人类心里和机器这里想的可能不太一样。逻辑上不太一样 朱波:人类想的我有可能花顺双出,我还是想打点价值 思晓:然后冷扑大师更没有,更跳出自己的手牌,更数据化的角度来判断。 开复:那思晓你会考虑用冷扑大师这种打法来作为你以后比赛的打法么? 思晓:会 而且我刚去打了一场比赛,现在世界上最顶级的这些玩家,也原来越去模仿机器人来下注,所以他一定是有特别优秀的地方, 朱波:其实这里就可以看出人类和机器的差别,机器就是我要赢,要结果。 思晓:对 开复:对 主持人:我们再来看一下合牌在掉了一张红桃5之后呢,张淮是下注7000, 思晓:我们人类做了一个6800底池的一个超池 主持人:冷扑大师是跟注了16600,这是一个两倍多的跟注。 思晓:有效筹码只有20000 主持人:他选择了一个all in 冷扑大师直接选择了all in,然后张淮就选择了覆牌。 思晓:这个很精准啊,首先,在不均等信息的情况下,我们看到了25,但是要是没有看到的情况下,我们可能会觉得对手是有A的情况的,很精准的一个反向的覆牌。他觉得这个牌面组合上面,对手的AK,因为翻前是有动作的。我们逻辑上翻前是有动作的,AK的组合,包括A 10 的组合是小于JJQQ,AJ的这样的一个组合范围。同时,对手手上是有可能有两张黑桃的,冷扑大师手上是没有黑桃的,所以对手有黑桃的可能性会更多,所以对手买牌破产的可能性也会更高。而且我们看到是356,现在牌面上最大的手牌应该是47,冷扑大师手里有一张4 同时有一张10,是可以组合掉很多顶端范围。我们在扑克里面去顶端范围的一些手牌,所以他用他组合掉的手牌去打对手的顶端范围里头这样的手牌,就是对手有47的可能性和对10的可能性又减少了。我们从AKK的可能性有减少了一些。47 的可能性又减少了一些,对10的可能性有减少了一些。那这里面可能对手咋呼的可能要多于他有牌有价值的可能。还是一个数学上面的一个逻辑。那这个时候他觉得下的三条金,他有可能A挂弱踢脚。那个10是不太能开得动牌的。所以他觉得是一个,扑克里面的术语是抓鸡没鸡大,因为存在一个JJQQKK的可能性,因为张淮有可能是有可能有JJQQKK的可能性。如果那10开牌,有可能会输掉。但我们刚才有分析到了,这个有牌的可能性要小与没牌的可能性。组合大于很多。所以他一个反向咋呼是一个非常好的选择。 主持人:我觉得我刚刚从看这几首牌的时候,冷扑大师做的动作都很流畅,就从翻牌前翻牌后,到转牌到合牌的时候都是一气呵成的感觉。比如这手牌,冷扑大师和刚刚alan的时候就打法是完全的不一样。 思晓:对,我们总结一下,冷扑大师偷鸡的时候人类没有抓他,而且他判断出了人类在转牌的一个偷鸡,然后去平跟,同时在合牌在阻挡一个偷鸡,这是他拿到25这手牌的时候的一个处理方法。然后人类偷鸡的时候。他去反向偷鸡,反向咋呼。所以这点是很厉害的。 开复:所以他那两边的牌都赢了。 主持人:好了,我们来看一下第二首牌。我们来看一下这是王天健和冷扑大师打的一手牌。王天健是A8不同色,是大盲,冷扑大师是5Q不同色。是小盲位。我们来看一下翻牌前冷扑大师是选择下注到250。 大盲位的王天健是选择平call 150。 我们看一下底牌发了843,两个红桃,天健选择在前位过牌。冷扑大师加注到250。就打了一个1/2。 思晓:这个应该就是一个双方都比较标准的下注吧。持续性下注。因为他是加注者。然后我们人类这边中了一个顶对,在单挑里面也是一个比较好的手牌。所以选择了抵抗,选择了平call。 主持人:底牌掉了一张黑桃7之后,王天健继续过牌,冷扑大师继续开枪 打了1115。这又是一个超炮。 思晓:他真的很有意思 主持人:我觉得冷扑大师的下注很奇怪。 思晓:昨天看了 一个报道,就是人类他们一个赛后总结的一个报道。这个冷扑大师转牌的一个下注量是一个非常恐怖。就扑克里面我们衡量一个高手的能力也是在转牌。老外起名叫转牌,英文叫turn,为什么叫转牌turn,就理解为种百转千回的意思,就是他决定了这个5张牌后续发展的一个最关键的点,就像我们融资可能A轮B轮之间的那样一个点。所以在转牌上表现的强势,一个是给对手心理上造就一个压力,然后造大这个底池,二是去更好的咋呼。 主持人:王天健是继续平call 1115, 思晓:人类已经发现了它这个规律了。然后在转牌做了一个抵对,这个牌面还是比较潮湿的。这个各种的组合。人类还是选择了抵抗。就其实人类也是根据他的打法有一些适当的调整。 朱波:如果我们反过头来看,如果这时候人类肯换一下,他打1000多,冷扑大师在这上面可能会打一个超炮。 思晓:对 朱波:如果反过来,现在王天健是平call,思晓你是冷扑大师你会打多少。 思晓:极限价值么,就是换一下手牌,如果没有位置的情况下可能会call,如果有位置的话做一些极限的价值 朱波:如果这时候他是8顶对,又是打踢脚 思晓:如果人类那这个Q5转牌都不一定赶有动作。 朱波:是 主持人:冷扑大师打的很激进啊。我们来看合牌掉了一张方片8之后,王天健是选择率先开枪打了一个3200满池。然后冷扑大师跟注到8900 朱波:在这一点我就看不懂了。冷扑大师又是采用这种bulafu的方法 主持人:将bulafu进行到底么? 朱波:对 主持人:然后天健选择all in。将底牌加注到了18300,应该是有效筹码都选择了 思晓:这个逻辑应该是说冷扑大师首先有一张5,我们这个牌面发这张8之前可能这个逻辑是成立的,56是成立的,同时为什么冷不大师选择加注的情况下,对手56的可能性很小。然后对手转牌没有一个反向的加注,和fulaop一个没有转牌的加注,所以代表他有对儿的可能性也是比较小。所以在看合牌的这张8,目前我们是结果论,我们看到王天健手牌很大,但是他觉得对手已经没有葫芦的太多可能性。但是没想到被人类拿了一个对,反向的打了一个更多的价值。这个是人类也对机器人的一个不信任了。但是冷扑大师是有逻辑的。现在前后他是有一定逻辑的,原因就是说,他觉得78和3344的可能性,从fulaopo和turn上已经完全排除掉了。确实是没有。因为人类从始至终没有反向加注。所以这个牌的组合确实是非常小一些。 主持人:这时候我们的冷扑大师就选择了覆牌。 思晓:对 没有么,因为实在没办法了。All in 朱波:那最后天健加注了,冷扑大师又打了8000多,是明显想打他的弃牌率。 思晓:对 要打他的弃牌率。 朱波:他如果all in 的话呢?但是他也是跟了,天健肯定会跟 思晓:对 这是为什么有10%的胜率的一个情况。 开复:这时候冷扑大师又是考虑了一个整个范围。All in 对他来说是非常不利的。因为对方一接的话,你就没有任何的记分牌了。 主持人:很聪明啊 这个冷扑大师。 开复:留下了一万块钱左右。输了10000的筹码 主持人:我们来看另外一手牌,还有最后一手牌了。这个童舟拿了一个QQ,超对。我们冷扑大师拿了一个红桃47。 Button位是冷扑大师。冷扑大师是选择加注到了250,而童舟是选择翻倍到了799,然后冷扑大师继续选择4倍的加注,3196。这个牌就是安全 思晓:童舟这个玩家平时也会一起玩儿。他可能是这六个人里面,相对的跟杜悦老师一样是比较激进的玩家。所以我会觉得冷扑大师发现了他反加注的频率,因为他看不到他是QQ,因为他发现经常翻前经常反加注对手。所以他做回了一个继续加注的抵抗。一定是之前的一个大数据,然后造成了他拿47这样的牌,做了抵抗。而且他确实挑对人了。从我的角度来说,这六个玩家童舟是最激进的玩家。 主持人:然后童舟选择了call 齐。我们来看一下底牌发了10 6 8,有一张红桃。在看到底牌之后,童舟选择了过牌。然后冷扑大师也是选择了过牌, 朱波:在这个时候冷扑大师的顺面蛮大的。卡5 卡9 主持人:那我想问一下童舟为什么要选择过牌么? 思晓:因为他也会担心么?因为翻前对手很激进,而且这个牌面也很复杂。感觉是一个超对,但是其实如果打下去AKK不赢,同时有可能撞到赢对手一个手对J,手对9都没有那么大一个胜率。有7和9的一些补牌在上面。所以这牌给我拿QQ,可能翻前我可能会推掉吧。这就是一些不太一样的玩法。当然,可能童舟和机器人打的更多,可能他会有他自己的一些想法。 开复:其实,如果你技不如人的时候,不如翻前推掉 思晓:对对 开复:而且你觉得你有50%的胜率,就推掉,因为之后你还可能更落后了。 朱波:真的,如果我技不如人的话,我看到QQ我在翻牌前结束战斗。我们两条鱼肯定是推掉了 开复:我们两条鱼肯定是推掉了 主持人:我们看到翻牌前底池就可能到了6392,我们来看转牌。发了一张黑桃4。这个时候冷扑大师是有对了。童舟是选择开枪。加注到4505。而冷扑大师选择了平call。这个时候冷扑大师的几手牌没那么挤进去,是因为底池已经很大了。就是后手已经不太够他打一个超炮之类什么的 思晓:嗯 一个是这方面的原因,一个可能是对手翻前的一个抵抗。有可能让对手盖到很多大对子,冷扑大师有可能分析到他把对手翻前抵抗的那个范围缩短到很窄很窄,那这个时候也却是很难在这个牌面上盖掉一个很大的对子。 主持人:我有一个特别搞笑的问题想问一下,冷扑大师你们看他前面几手牌,就从来没有在翻拍,转牌弃掉牌过。永远都是在合牌别人推出来,如果他是bolafu他就是弃掉牌。他为什么在这个转牌的时候,击中了一张4还是不会弃牌还是要平call呢? 思晓:嗯,首先是说我们看到对手是QQ了。对手如果是翻前抵抗,我觉得不太会抵抗那种太杂的一些手牌,但是也会有一些AQ,JQ、或者AK这种,所以他可能在组合上面,但是我现在算不了太多细节的组合,但是会有一些手对子的组合,但是会miss掉一些JQ 9J类似于这样的组合在上面。 朱波:不过,如果换过来,人类打这手牌的话,当他下注到4000多的时候,肯定就盖掉了 思晓:人类肯定就翻前盖掉了。 朱波:所以这个机器的想法 开复:但是我们必须假设他是对的,所以表示我们必须要学习,要是我肯定就盖掉了 朱波:对啊必须要学习 要是这手牌的话,人类的话,我也肯定盖掉了,肯定打都不敢打。 开复:所以大家学习啊学习。因为范围可能会降低一点,但是也没有低到这个地步。 主持人:那么这个时候我们看到底池已经到了15400,我们看到了合牌掉了一张黑桃7之后,冷扑大师成了双对儿, 思晓:我觉这张如果不是黑桃7的话,他合牌一定会下注。我刚才没有想过这个问题,有可能他会打一个极限的价值。但是因为这张是黑桃7,所以对手可能call了黑桃AJ,黑桃AQ,黑桃AK,。因为多了黑桃AJ AQ A9 AK包括A小的这种同色的一个金的可能性,我刚才还在思考他为什么合牌没有下注,因为封锁到了一个首对子,就是因为有了一个金的组合,所以他认为没有更多的保价在里面。这也就更能判断出冷扑大师对这个组合的一个下注的一个比例的精细程度。我觉得是蛮厉害的。 主持人:所以在合牌黑桃7发出来之后,两方都选择了过牌,开牌 思晓:对 主持人:这也是我们看到了四手很精彩的人类和冷扑大师的一个精彩对决。李开复老师也看到这四手牌,您能跟我们介绍一下冷扑大师的打这四手牌的决策的原理么? 开复:决策的原理就是不断在评估,自己的所有的可能性和对方的所有的回应的可能性。还有下面会发出所有牌的可能性,。就是不断推下去,因为其实一方面我觉得德州扑克的搜索空间是比较小的,因为一共就是这么共有的5张牌加上你的两张手牌,他是可以穷尽的搜索可能性,那他所要做的事情就是平衡人类所有不同的打法和他如何选择一个让人非常两难的空间。就想比如说,我们玩剪刀石头布,如果你用任何的策略去push 1/3 1/3 1/3,那对方就会找到你的弱点。所以这个时候冷扑大师在这个时候就会说好,那剪刀石头布我各1/3。当然这个例子是非常简单的。在这个例子里他就会把各种不同的牌型去判断,当我碰到某种牌型的时候,我应该百分之多少时间这么打,百分之多少时间那么打。那么最后呢,他是最优化对手犯错的可能性和自己得到最多积分码的可能性。 主持人:我特别想问一下思晓,你刚看了这四手牌之后,你能点评一下人类牌手的一个发挥么? 思晓:我觉得,首先都有优点,王天健在A8的那一手牌打得很好,他也对机器人做了一个范围的调整。然后包括童舟和张淮他们也之前做的这些都是很标准的。包括张淮拿25做了一些转化。平衡了自己手牌的范围。就把扑克里面重要的概念其实已经传递的不错。 主持人:那朱波老师刚看了这四手牌,有什么让您匪夷所思的这种牌型么? 朱波:我觉得匪夷所思的话,机器人在合牌这个领域,这个节骨眼上,明明知道自己落后了,他还继续强行加注,尤其是在turn上打的特别激进,所以在这里面,我感觉人类还是带有情感因素,患得患失,比如像刚刚拿手牌,如果换成人类的话,可能当王天健加注的时候,人类就有可能覆牌了。而冷扑大师反而反加注,所以这个事让我感觉到人类在打牌的过程当中,是不是被情感,可能因为是空军,因为机器是0和1,他是没有恐惧,我要这个结果,要么有要么没有,人呢,就是有灰色地带,灰色地带的话,会不会影响人类在下注筹码时候的忧郁的感觉。这点是不是在1对1 的比赛中,人类几乎很难跟机器有所对抗。 开复:我觉得可以这么想,冷扑大师呢他可能已经对他的对手的恐惧感已经有一定的把握,。他认为这个对手的恐惧感是比较强的时候,他就会更倾向于选择一个大的下注,因为他打这个出来,虽然有时候会被call会输掉,但是赢的可能会更多。他会有这样的一个判断。 主持人:朱波老师您之前也组织过私人的比赛,然后这次德扑人机大战,您有没有分析一下技术原理? 朱波:其实我觉得人机大战呢这个从1对1的角度上来讲,就开复老师讲的,10%也是对人类的一个安慰,其实就是几乎没有胜的可言,其实这里面是对每一个人的分析,就想我今天打完以后,马上就能够学习,明天就是一个专业对付你的人,所以在人类当中呢,我觉得我们在打这种单人的这种比赛呢,我觉得是可能性不大的,未来是不是在多人的比赛中,人类会不会有机会赢 开复:我觉得会赢,因为今天还没有开发出很好的多人的德扑机器人,但是我觉得这应该有人要做开发,一年之内也应该可以把它衍生出来。 主持人:还想问一下开复老师,相似技术的应用情景分析。那么人工智能除了打德州扑克,还有下围棋,您觉得以后还能做什么呢? 开复:哦不是以后了,其实是今天。因为我们已经被人工智能围绕了,你手机里的应用,百度,淘宝,淘宝推荐让你买的东西,滴滴怎么帮你搭车,今日头条怎么帮你排序,知乎怎么让你知道答案,这一切都是背后是人工智能。那除此之外,我觉得最大的机会应该是在金融领域,因为基本上人工智能是一个大数据的游戏,但任何的一个领域,它基本上是一个特别大的数据而且又是可知的结果,对吧,你贷款还了没有,买一只股票他涨了没有,都是非常明确的,所以越明确的这种大数据信息呢越好用。所以金融之外,我觉得还有医疗看片子,然后人脸识别,物体识别,语音识别这个一个个算下来,我觉得大概在十年之内,人类现在所做的50%的工作都会被机器所取代。所以最近呢我也写了一本新书,就叫做人工智能。这本书现在可以开始预购,在里面我描述了人工智能的基本的技术,更总要的讲了他的应用和发展的蓝图。还有作为一个年轻人,要怎么样去选择自己事业的发展才能不会被人工智能机器人所取代。 主持人:那我刚刚也有回顾今天和昨天比赛的状况,人类在11400手牌里,已经落后了19w多分的差距,然后您能给预测一下接下来的走势么? 开复:走势应该是越来越不妙,因为机器不断的再学习,人也在学习,因为杜老师每天都会把团队召集起来做练习。然后用各种方法告诉大家试着怎们打,然后学到了什么东西,看来机器学习的速度会更快,所以我会预测差距会越拉越大。但是我觉得就想阿尔法狗对战李世石,李世石最后赢了一局,让我们人类保留了一点尊严,所以我也希望杜悦老师能够在未来的七场中会有一场胜出,还是会有可能的。 主持人:这么说来,开复老师会认为人类本次胜率的是不足10%哦,我想问一下思晓,你觉得人类的胜率大概会有多少呢? 思晓:嗯 我不太了解这个整个的东西,但是我觉得我们肯定是占劣势的,然后未来也是会被机器人了解的越来越多。我们的劣势一定会越来越大,我觉得鼓鼓劲吧给他们,希望他们可以更好,因为昨天我有看到他们牌手是有赢单场,我希望未来在单场的比赛中还是可以看到我们牌手的精彩表现。 主持人:好,作为一个美女牌手,你对这个机器人这个踏进德扑圈的领域你有什么样的感受么? 思晓:我觉得,我快失业了的那种感觉 开复:不可能 不可能,我觉得以后打德扑应该是越来越多在线下了,因为线上你没法分辨对手是人还是机器 思晓:对 主持人:那么据说4月10号的时候,两位嘉宾会来参加一个表演赛,你们对这个表演赛有什么期待么? 开复:因为我德扑打的不好,我觉得我就是应该来犯一些很大的错误来让大家嘲笑的。 思晓:我是为了体验人生,特别感谢开复老师给了这次机会,可能有生之年很早的接触到这些,然后能坚持多久就坚持多久吧。 主持人:我们今天也谢谢三位嘉宾做客新浪直播间,然后也希望各位观众持续关注我们新浪体育和新浪科技以后的直播,谢谢。 (文玄) [详情]

李开复点评德扑人机战:AI会向人隐瞒信息?
李开复点评德扑人机战:AI会向人隐瞒信息?

  新浪科技讯 4月8日凌晨消息,“冷扑大师”VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第二天的比赛。全天共8400手牌,龙之队一共输了347565分,与冷扑大师之间的积分差距相当明显。 4月7日下午,创新工场创始人、董事长李开复做客新浪直播间,为大家讲述了他眼中的德扑人机大战以及未来人工智能技术的应用前景。 以下为新浪科技根据李开复博士所讲内容整理: 就像AlphaGo打败了世界冠军,德扑AI程序Libratus也是打败了美国最顶尖的选手。 人 类第一次输了1万多分,第二次输了5万多分,第三次输了12万多分。我们可以看到,第一次几乎是不相上下的情况,代表中国派出的选手真的很强。但是“冷扑 大师”在打完每一场(section)比赛之后,他就会进行机器学习,针对每一位牌手的弱点调整自己的参数。所以在第一天下午的比赛,他就化身为6个“冷 扑大师”,针对每一位牌手的弱点调整参数,借此把差距拉到5万;第三场比赛再学习,便领先了12万。 我们可以看到机器的自我调整是非常厉害,非常可怕的。 “冷扑大师”如何学会打德扑 其实“冷扑大师”和AlphaGo的差别还是很大的。 “冷 扑大师”从来没有学过人类的牌谱,而AlphaGo先从人类的牌谱开始学起,之后再自我提升。“冷扑大师”几乎是从博弈论的理论加上德州扑克的规则,自己 再不断地推进算法,所以他每一次下注与否或者每一个决策都是针对人类所有的可能性做出一个最有利于他自己的判断。这个判断做出来以后,无论人类怎样回应, 对于“冷扑大师”来说都是接近最优的。而且“冷扑大师”还会不断优化自己的打法,让对手无法猜测,但他却可以猜测人类的应对方式。 如果你把“冷扑大师”的盖子掀开来,你会发现里面其实是一个特别巨大的数据库,它储存了所有牌的排列与组合,还有在当即的排列与组合之下如何去寻找一个平衡点,好让对手无法猜测出你有什么牌。 所以归根结底,还是一个巨大的统计系统。 人工智能会向人类隐瞒信息? 从 “冷扑大师”的表现上来看是在隐瞒信息,但实际上这是人类教他的。现在所有的人工智能的工具,无论是机器人、无人驾驶,还是AlphaGo或者“冷扑大 师”,本质都是人类写的代码,人类操控的工具。所以他们是受人类管的,他没有意识操控自己去隐瞒信息,之所以表现出来隐瞒信息实际上是他的编程者叫他这么 做的。所以不用太担心未来机器人会欺骗我们。 和围棋进行一个对比的话,我们可以看到围棋的黑白子都在棋盘上,完全公开没有隐藏的。我们可能 要问,真实的应用在什么地方?需要明确的是,人的真实应用很少会全都暴露出来,德扑可能更适合应用于你去买一套房子——标价900万,你的心里预期是 850万,你是该出700万慢慢往上加呢?还是直接出840万,拒绝加价呢? 说到这,我们发现商业谈判其实和德扑是很像的。这也意味着德扑未来可以克服商业谈判,甚至是政治外交、国际关系处理上的一些问题,帮助人类做出决策。 “冷扑大师”会穷尽所有可能性 “冷扑大师”不断地评估自己的所有的可能性和对方回应的所有的可能性,还有接下来发出的牌的所有可能性,如此往复,不断推下去。 一 方面,德州扑克本身的搜索的区间是比较小的,因此“冷扑大师”是可以穷尽地搜索所有的可能性的,他要做的事情就是去平衡人类的不同打法以及自己如何选择一 个让人类感到两难的打法。最后的目的就是最优化对手犯错的可能性和自己获取更多积分码的可能性。打个比方,两个人玩石头剪刀布,如果你用任何策落的概率不 各是三分之一,那么对方就会找到你的弱势。 实际上,除了AlphaGo和“冷扑大师”,我们现在已经被人工智能技术围绕了。百度、淘宝、滴滴、今日头条、知乎等公司在其各自服务用户的过程中,都已应用了人工智能技术。 除此之外,人工智能应用场景还包括金融领域、医疗领域、语音识别、人脸识别等。我预计在十年之内,人类从事的50%的工作都会被机器取代。 希望人类选手能赢一场 目前两天四场比赛15600手牌过后,龙之队共落后412702分,平均每百手损失26.2个大盲注。龙之队与“冷扑大师”之间的积分差距已经相当明显。 形势越来越不妙,因为机器在不断的学习,当然,人类也在不断的学习。但很明显,机器学习的速度更快,因此我预测差距会越拉越大。 AlphaGo对战李世石的比赛中,人类选手最后是赢了一局的,这也为人类挽回了尊严。希望在未来的7场比赛中,我们的中国德扑选手也可以获胜一场。(徐利)[详情]

为什么说德扑人机大战是表演赛 AI带我们去远方
为什么说德扑人机大战是表演赛 AI带我们去远方

  昨晚在做赛后采访时,龙之队的队长杜悦老师说了这样一句话:“一旦科学找到正确的方向,前进的速度是惊人的。” 虽然落后人类并不气馁 4月7日的两场比赛,龙之队其实输了蛮多积分的,冷扑大师在牌桌上表现出的强悍与冷酷,水平越高的人越能感受得到。不过龙之队的选手们并没有太多气馁的氛围,反而是变得越来越兴奋。这种兴奋来源于人类天生想去挑战更强的冲动。 这个落后和实力差距其实赛前大家是有所预估的,一方面是冷扑大师已经在美国的比赛中战胜了四位外国的德州扑克顶尖高手,另外一方面去年围棋人机大战李世石的失利已经帮我们所有人类做了一次应对失败的心里建设。 输掉人机大战后难过的李世石 去年3月12日,李世石与AlphaGo人机大战第三局,李世石认输的一刻,不光是围棋人,很多不懂围棋的人都经受了巨大的心理震撼。人工智能真的已经来了。一年的时间过去,人工智能的话题不断发酵,人们已经接受了AI在某些智力领域强于人类的事实,甚至遥望到了更广阔的未来。 从人工智能身上学到的 作者德州扑克虽然仅停留在明白规则的最基础阶段,但从六位龙之队牌手的表现和直播嘉宾的讲解来看,他们从与冷扑大师的比赛中,获益匪浅。 六位牌手分为A、B两队,分别拿到的是镜像牌。A组杜悦对应的是B组张淮对手电脑的牌,A组朱亚希对应的是B组王天健,A组童舟对应B组许朝军。比赛时是允许本组的三位队员探讨牌型和打法的。六位牌手在昨天的比赛中都不时惊呼出声,本组的成员也经常一起讨论AI惊人之举。许朝军在比赛结束后还不时回味冷扑大师的某些手牌打得“太漂亮了”。 牌手们技术讨论 直播嘉宾拿到牌例时,经常会对冷扑大师的一些做法感到意外,但经过仔细一分析,会发现其中的必然性和合理性。德州扑克毕竟是个不完全信息博弈,而且在翻牌、转牌、河牌时都有胜负翻转的机会,具体到某一手牌冷扑大师的结果虽然是输的,但它在全程的打牌动作上,很多时候只能用完美来形容。 随着与冷扑大师交手的增加,人类能从中学到的就更多。这一点和去年的围棋人机大战何其相似,大家从开始对AI招法的怀疑甚至批评,到后来仔细品味后的认可甚至追捧。 AI是为了帮人类做到更好 专心致志比赛的朱亚希 朱亚希非常享受这次比赛的过程,每天都是最后一个结束的,她说跟冷扑大师打牌是一个难得的学习机会。对人工智能来说,无论是德州扑克还是围棋都是非常完美的测试模型,在这些模型里,人工智能可以从基本规则向最终真理趋近。所以杜悦说:“一旦科学找到正确的方向,前进的速度是惊人的。” 冷扑大师可预见的未来会成为人类职业牌手的参谋,当然前提是它能够解决多人游戏和不同筹码量问题的时候;围棋的AlphaGo或者说Master已经达到了一个导师的程度,可以给人类职业棋手不少启发了。 人类发明汽车,不是为了跟自己赛跑,而是能够载着我们来到达更美好的远方,人工智能也是这样。所以这次德州扑克人机大战,发起人创新工场的李开复给出的定义是“表演赛”,目的是为了让人们更好的了解人工智能的前沿技术,更多的关注的德州扑克这个有趣的智力竞技。 李开复昨天做客新浪演播室畅谈人工智能的未来 (周游)[详情]

杜悦:胜算还是10% 朱亚希:AI偶尔会犯蠢错误
杜悦:胜算还是10% 朱亚希:AI偶尔会犯蠢错误

  4月7日晚,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第2日的全部比赛。赛后龙之队队长杜悦表示虽然目前暂时落后,但基于德州扑克这个项目不确定性,龙之队还是有10%的胜利可能的,朱亚希则分享了一些比赛中的趣事,AI有时会犯一些人类看起来有些愚蠢的有趣错误。 记者:先聊聊今天的情况。 杜悦:虽然没看到统计,但我觉得我们今天平均下来每场要输10万以上……B队的许朝军其实前三场都在水上(积分领先),但今天下午也被打到了水下(积分落后)。 记者:怎么形容这个对手? 杜悦:AI就像一个技术非常高,而且不会“上头”的顶尖牌手,我是把它假想成这样一个人类对手。其实这几天的成绩,我们也分析了下,具体到每场比赛,AI分别对我们的队员,也都有“水上”、“水下”。今天下午虽然输了不少,但我们也是有两位队员在水上的。只是AI在水下的时候,也不会输很多;而我们队员经常在水下很深的位置。想把AI打成一个碾压的结果非常难,而我们人类在落后的时候很难做到心如止水。 记者:之前您提到龙之队有10%的胜率,现在估计还有多少。 杜悦:其实10%的胜率还是在那里,没有变的。 记者:这次人机大战作为一个历史性的时刻,您有没有压力。 杜悦:我个人对这次比赛是有些情结的,我以前是做计算机的,所以无论输赢我们都见证了一个人工智能的发展历史时刻。 记者:今天你是最后一个打完的,冷扑大师是不是比昨天更难对付了? 朱亚希:我昨天也是最后一个打完的呀,我感觉还好,差别不大。 记者:跟AI打牌和跟人打牌最大的区别是什么? 朱亚希:如果是人类对手他可能会有一些固定的习惯,我们会根据这些习惯做针对性的策略。但AI似乎都是根据计算,很难摸清固定的套路。我们现在的打法是,抓AI一些细节处理上的不细腻,而且AI会犯一些在我们人类看来很愚蠢的错误。 (周游)[详情]

德扑人机第2日冷扑大师下“狠手” 龙之队惨败
德扑人机第2日冷扑大师下“狠手” 龙之队惨败

  4月7日晚,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第2日的全部比赛。全天共8400手牌,龙之队一共输了347565分。目前两天四场比赛15600手牌过后,龙之队共落后412702分,平均每百手损失26.2个大盲注。龙之队与冷扑大师之间的积分差距已经相当明显。 6日全天7200手牌,龙之队落后65137分。今天冷扑大师似乎展现出更为冷酷的一面,人类损失的积分进一步扩大。全天共进行了8400手牌,龙之队一共输了347565分。上午的第三场输了186842分,第四场输了160723分。 全天赛后龙之队队长杜悦和朱亚希接受采访 由于今天比赛的手牌数增加,整体比赛的时间变长,上午发布消息时有的牌手尚未打完全部手牌。上午龙之队其实遭遇了比想象中更大的打击,平均每手牌损失将近45个大盲注。下午成绩依然不佳,面对强大而冷酷的冷扑大师,龙之队遭遇了前所未有的挑战。 这样的一个差距,在德州扑克比赛里已经属于比较大的了,平均每百手牌,人类要落后个26.2大盲注。 前四场比赛龙之队成绩统计 4月7日、8日、9日上午,还将进行五场正式的挑战赛,赛程已经超过1/3,人类还有20400手牌的机会翻盘。在德州扑克的桌面上,什么事情都有可能发生,我们一起期待。 (文玄)[详情]

视频-李开复李思晓朱波做客新浪 畅谈德扑人机战
视频-李开复李思晓朱波做客新浪 畅谈德扑人机战

  4月7日,李开复、李思晓和朱波做客新浪演播室,为德扑人机战复盘并畅谈人工智能。 以上是相关视频。[详情]

许朝军:AI好像有读心术 张淮:人类变得艰难
许朝军:AI好像有读心术 张淮:人类变得艰难

  4月7日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆继续进行,两位早些结束比赛的人类牌手接受了新浪的专访,他们均表示第三场开始,冷扑大师比昨天变得更强了,而且很多手牌打得非常精彩,令人拍案叫绝。许朝军坦言感觉AI有读心术。 在上午进行的比赛中冷扑大师扩大了战果,反应到比赛现场的表现上,几位龙之队的牌手不时发出惊呼,与同组队友沟通冷扑大师的打法的精彩之处。许朝军和张淮两位牌手率先完成了700手牌的比赛,接受了新浪网的专访。 新浪:上午的比赛感觉怎么样? 许朝军:我觉得冷扑大师的策略和昨天相比有了很大的改变,变得很“凶”(德州扑克专业属于,打牌时加注等技术操作使用频繁,不轻易过牌)。我今天上午的比赛可以说是大起大落,中间几度反复,倒数第三把牌的时候我总算又赢了回来,上午的总战绩在“水上”。(水上是指赢得的积分超过AI,水下是指积分输给了AI,水平线则是双方打平的那条线) 新浪:冷扑大师变得更强了么? 许朝军:是的,他变得步步紧逼,而且是个“铁头”,读牌非常准。我们的诈唬很难骗到它,而它的诈唬动作运用的非常频繁,进攻性十足。我有种它有读心术的感觉。 新浪:感觉今天龙之队都很兴奋 许朝军:确实,有几把牌,AI打得真是太漂亮了。外我是全队的体能教练,也在帮大家调整神状态。 许朝军说这段话的时候,作者不禁想起来去年围棋人机大战第二局的时候,AlphaGo在布局下出令人惊艳的思路尖冲,棋圣聂卫平感叹:“就凭这手棋,阿老师值得我们脱帽致敬”。 张淮上午似乎状态不佳 新浪:上午的比赛怎么样? 张淮:上午我成绩不太好,一方面是牌运不佳,另外一方面可能还是技术上的问题。虽然比赛采用的是复式发牌,我这边牌不好,都会以为队友那边牌比较强,但很可能不见得是这样。具体要等到我们一起复盘的时候再看。 新浪:冷扑大师是不是今天有所变化。 张淮:其实还好,我觉得我主要的问题还是在自己,昨天整个人状态比较紧张,成绩还可以。今天有点放松。但今天明显我们打牌时要思考的东西变多了,变得艰难,从这种意义上讲,对方确实变强了。希望全队只是我的成绩不好,整体能赢。牺牲我一个,幸福大家。 新浪:下午继续加油! 张淮:谢谢。 不过,上午最终的结果并不像张淮希望的那样,只有他的成绩不好,上午的奖金4200手牌比赛,人类配上输了19万多的积分,与冷扑大师的差距进一步扩大。人机大战中,人类状态、心理、体能上的劣势也开始渐渐显现出来。 (新浪体育周游 发自澄迈)[详情]

德扑人机第3场人类惨败 冷扑大师大幅扩大领先
德扑人机第3场人类惨败 冷扑大师大幅扩大领先

  4月7日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第3场比赛,本场六位牌手共与冷扑大师打了将近4200手牌,截至13时落后那么多,共输了126454分。算上昨天的损失,人类在11400手牌里,已经落后了191591分,双方的差距越来越大。有几位牌手暂时还没有完成比赛 4200手牌的数据稍后更新。 6日全天比赛人类牌手共输了65137的积分。平均到每100手牌,人类输9.02个大盲注。然而今天冷扑大师打法变得更加强悍,上午每人和机器打了700手牌,共进行了4200手较量。龙之队惨遭重创,共输了126454分,平均每百手输30.1个大盲注。本场六位牌手共与冷扑大师打了将近4200手牌,截至13时落后那么多,共输了126454分。有几位牌手暂时还没有完成比赛 4200手牌的数据稍后更新。 三场比赛战罢,共进行了3600+3600+4200=11400手牌,龙之队总积分落后191591,平均每百手损失16.8个大盲注。 下午16时,将继续进行第四场对抗 ,人类能否反败为胜呢?我们拭目以待。(文玄)[详情]

视频-Dan Colman罕见桌上开口 对手上钩跟他Allin
视频-Dan Colman罕见桌上开口 对手上钩跟他Allin

   Dan Colman罕见在牌桌上开口,为了让对手跟他的Allin真是拼了,细细品味那每个表情都是演技啊!视频来源:中扑网[详情]

视频-德扑小白教学 3分钟教你学会德州扑克
视频-德扑小白教学 3分钟教你学会德州扑克

    德扑人机大战激战正酣,对德扑感兴趣的小白们,此时无疑是入门学习的极佳时机!传奇扑克特意为您制作德扑小白教学视频,3分钟教您学会德州扑克。[详情]

第一日:龙之队微处下风 但冷扑大师似乎还没发力
第一日:龙之队微处下风 但冷扑大师似乎还没发力

  新浪科技李根 发自海南 德扑AI冷扑大师与中国龙之队的人机大战已经完成首日比赛。 从结果来看,全天累计数据方面,冷扑大师领先 65,137记分牌。其中,上半场冷扑大师领先中国龙之队14,145记分牌,下半场冷扑大师领先中国龙之队50,992记分牌。 这并不是一个差距明显的数据结果。至少冷扑大师展现出的优势并不明显,特别是在上午进行的上半场比赛中,也就可能只是一手牌中的运气之差而已。 但是下半场开始,人和机器的区别开始展现,伴随着一声“wocao”的感叹在比赛区响起,分水岭开始出现,据比赛结束后说,那是一手特别不错的牌,但最后没能从机器那边赢过来。 龙之队赛前合影 冷扑大师这边,主创开发团队也已从匹兹堡飞抵现场,让这些科学家感兴趣的是:龙之队半德扑半计算机背景的经验,他们渴求通过这次比赛看到一些不同的情况,有有意思的点发生。 不过,冷扑大师的开发者成员也表示:“以守为攻”的冷扑大师,第一日的比赛肯定不会有特别明显的优势展现,但差距也会随着时间而拉开。 实际上,如果回顾冷扑大师在1月30日的匹兹堡职业比赛中击败职业德扑玩家的统计图,也能看到比赛形势走势图呈现的是陡梯状——越往后差距会越明显。 但目前龙之队似乎心情和状态并未受到影响,领队杜悦在第二日比赛前调侃称:昨天稍微有一小点“不走运”。 龙之队队长杜悦登入系统 卡顿了 有意思的是,表现出“愁眉苦脸”的反倒是领先者冷扑大师的开发者,今天比赛开始前,网络登入还是不同程度有延迟和卡顿,但也比昨天要好了——毕竟第一天刚比赛就不得不重启了大洋之外的超级计算机,也算是这次德扑人机大战最富戏剧性的花絮了。 看来,战胜机器的唯一办法,还是得从源头想办法(真诚微笑脸)。[详情]

高清-德扑人机大战第2日 人类牌手赛前集体合影
高清-德扑人机大战第2日 人类牌手赛前集体合影

  [详情]

德扑人机首日龙之队感受:互相试探 发现AI弱点
德扑人机首日龙之队感受:互相试探 发现AI弱点

  4月6日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了首日的比赛,7200手牌之后,人类暂时总积分落后65137分。赛后六位龙之队的成员也分享自己首日比赛的感受。 杜悦:人如其名,冷冷酷酷的德扑大师。内功极其深厚,不亏是科学的结晶。我自己平时打牌,是比较松凶的,能够碾压对手就碾压,所以上午也是这样,结果被碾压了。中午和队友做了一些沟通,下午变得比较稳健,再加上牌比较好,所以效果还不错。 朱亚希:下午冷扑大师给我们的压力比上午大了,经常让我们处于比较为难的抉择当中。整体而言,我觉得他像将军一样,打法很大气。比赛之前我们比较懂计算机的队友透露过,AI在河牌转牌时很厉害,算得比较准,所以我的打法是尽量不要进入到河牌转牌阶段。 童舟:和人类高手打区别很大,我们都是找它的弱点。 许朝军:比赛前我说准备了七十二变的打法,但今天发挥了73种。我还加上了冷扑大师的打法。由于比赛是计算团队的积分,所以我的打法跟我平时自己打会有些不同,可能错过了些机会。 张淮:今天AI比我想象的弱,但实力确实还是很强的。我们有六个人,还是有机会的。我下午故意做了一些不规则的加注,希望找到AI计算上的误区。比如AI计算可能是1000、2000的加注可能,我故意加到1200,在AI的计算里可能是会四舍五入到1000的策略里。一次加注误差一点,到最后可能会积累到不可忽略的数量。我是希望通过找到它这个的计算的误区,来寻找它的破绽。 王天健:第一天我们其实是在互相摸底。这不是一场纯粹意义上的德扑比赛,我今天有一些奇怪的打法,主要是想给AI一些误导,我们是在测试,看看AI是否有漏洞。我今天发现其实它有,不知道明天是否会修补上。我们能看到冷扑大师是有思考时间的,如果我们的策略不在它的常规思路里,它的思考时间相当长。有些牌它是犯了人类不会犯的错误,后面不知道是不是还能够利用。 (路西法)[详情]

德扑人机第2场机器扩大优势 冷扑大师判若两人
德扑人机第2场机器扩大优势 冷扑大师判若两人

  4月6日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了首日的比赛,下午的比赛人工智能“冷扑大师”和上午判若两人,打法变得犀利精确。人类牌手7200手牌之后,共输掉了65137积分,暂时每百手落后9.02个大盲注,虽然处于明显劣势,但还有翻盘的机会。 上午共进行了3600手牌,人类落后14145积分,比赛采用100的大盲注级别。平均下来,冷扑大师每百手领先3.92个大盲注。这个差距在德扑比赛里是在误差范围之内的,领先5到10个大盲注,则是领先的状态,超过10个大盲注则是碾压的状态。 下午的比赛有打了3600手牌,人类牌手共输了50992积分,全天比赛人类牌手共输了65137的积分。平均到每100手牌,人类输9.02个大盲注。虽然人类目前暂时落后,但后面还有翻盘的机会。 直播嘉宾司文和里昂明显感觉到下午“冷扑大师”的打法变得更加犀利和精确,可能是从上午的牌局数据里,已经读出了几位对手的策略,并做了针对性的调整。而龙之队的几位则明显感受到了压力。龙之队似乎也有过沟通,在打法上有些变化,但目前看成效不大。 龙之队队长杜悦老师在打法上变化最大,上午他打得非常激进,下午“火花”似乎渐渐熄灭了。打法的改变,加上牌运不错,杜悦的个人成绩提升了。不过龙之队整体输的更多了一些。赛后采访龙之队的成员表示,第一天可能大家都还是互相试探,后面会在打法上有更针对性的调整。 4月7日至10日,请继续关注德州扑克人机大战的相关报道。 (文玄)[详情]

白话AI:德扑人机大战为什么人类还有赢的可能
白话AI:德扑人机大战为什么人类还有赢的可能

  柏林森,资深计算机行业从业者,深度围棋、德州扑克爱好者。此次以新浪棋牌特约评论员的身份和我们一起关注德州扑克人机大战。我们精选了一些小白问题(其实就是小编自己想不明白的)来请教柏老师,制作了《白话AI》的栏目。 问:李开复说德州扑克人机大战人类胜率有10%,而围棋是零,你怎么看? 答:我们假设真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变化,那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3,而他拿着对A。那么这手牌,德扑之神肯定是“All IN”的。但河牌是有可能发出一张3的,最后输的是德扑之神。 围棋和德扑有本质上的区别,围棋是完全信息博弈,理论上有最优解。德扑是非完全信息,总是有概率的。德扑水平的较量要看长线收益,打得手牌越多,小概率事件所能造成的影响就越少。这次一共只打36000手,其实人取胜的概率比想象的大。 可能要跟柯洁下人机大战的AlphaGo当然还不是围棋之神,但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低。不过,在数学上0%并不代表着不能发生,只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候,我们都称之为奇迹。 德扑人机大战直播画面 问:听说冷扑大师没有用最近比较热的深度学习的技术? 答:冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里,理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样,人类和机器的输赢相加和为零,双方的目的都是为了赢棋对手手里尽可能多的筹码。 我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到,如果我很均匀的按三种各1/3的概率出,那么无论对方怎么出,最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果。 如果对手只出石头和剪子,在我1/3策略不变的前提下,我的胜率还是1/3。但一旦我读到了对手的策略,做出相应的改变,那么对手的胜率将会大幅下降。所以对手的最优策略也应该各出1/3,这样能够保证自己的胜率不会低于1/3。 各出1/3就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布,而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略。 具体到某个牌手,机器会通过数据分析牌手的策略,寻找其中的可利用性,加以打击。这也是为什么上一次冷扑大师与外国牌手人机大战,前面差距不大,后面人类越输越多的原因。 所以目前看来冷扑大师和深度学习暂时没什么太大关系。 能按照训练AlphaGo的方式训练小白么…… 问:我如果有足够的高手牌谱,是不是能用深度学习训练出德扑AlphaGo来? 答:不能。两者游戏的基本算法逻辑是有很大区别的。举个例子,两个高手打牌的各种操作,反馈到扑克游戏里,最后的结果可能并不一样,因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子,最后的结果是肯定的,不是黑胜就是白胜。从这种意义上讲,AlphaGo使用的那种棋谱学习的模式,是无法复制到德州扑克里的。 (文玄)[详情]

重置筹码只能单挑 冷扑大师距德扑之神有多远
重置筹码只能单挑 冷扑大师距德扑之神有多远

  4月6日上午,“冷扑大师VS中国龙之队”德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆打响,关于比赛的种种细节也终于揭晓。冷扑大师目前只能进行每局重置筹码的1V1比赛,人类德扑比赛常见的多人桌赛制,它暂时还不能挑战。 人类牌手打牌速度远胜AI 人类可以同时打两副牌 龙之队分成A、B两队,杜悦、朱亚希、童舟在A队,许朝军、张淮、王天健在B队。两队分别与冷扑大师对抗,采用复式发牌。A队人类拿到的手牌,是B队电脑的手牌,A队电脑的手牌是B队人类的手牌。 每位牌手面前有两个电脑,因为冷扑大师打牌速度较慢,人类可以同时打两副牌,时间上完全来得及。据了解冷扑大师采用完全数学的模型和算法,后台的计算机群计算量非常之大。所以目前情况来看,人类打牌的速度比AI快不少。 4月6日至10日上午,六位人类牌手将和电脑鏖战九场,共计打36000手牌。每场比赛结束后,官方会公布龙之队和冷扑大师的总成绩。10日下午将安排名人体验赛,由科技、创投、娱乐界名人组团,感受人机大战。 每局重置筹码 每局的基本筹码量要重置 具体到每局比赛都采用1V1单挑的模式,而且每局重置筹码。每局开始时,每位牌手有20000的筹码,大盲注100,小盲注50。这手牌打完之后,无论结果如何,下一局双方的筹码都要重置回20000。 这样的方式在某种意义上降低了电脑方面的难度,手中筹码量的不同,在打牌策略上也会有很大变化。而目前的冷扑大师还无法做到在不同筹码量的前提下,与人类对抗,因为初始等量筹码和不等量筹码在数学模型的建立上有本质上的区别。 名人赛也是1V1 比赛现场 本次德扑人机大战还安排了名人体验赛环节,但和之前传言名人赛采用多人局赛制不同,名人赛也会采用和表演赛一样的1V1模式。目前冷扑大师还无法进行多人比赛。 按照开发者卡内基•梅隆大学计算机科学学院院长安德鲁•摩尔的说法:“德州扑克中最考验牌手技术的反而是双人对战,如果有更多牌手的话,其他牌手间的技术差别反而会被利用。” 从技术层面这种说法也有一定道理,但德州扑克比赛,多人赛制是常态,而且偶然因素更多,也更加刺激。从基础策略模型的角度上分析,多人赛制和现在单挑的模式有本质上的不同。 这次比赛只是德扑人机大战的第一步,如果有一天冷扑大师能够在多人比赛中从头打到底,完美应对不同筹码量的问题,那么我们才敢说,人工智能在德州扑克项目上已经击败了人类。 (新浪体育周游 发自澄迈)[详情]

视频-德扑人机战发布会举行 李开复为龙之队站台助威
视频-德扑人机战发布会举行 李开复为龙之队站台助威

   4月5日上午,冷扑大师VS中国龙之队人机巅峰表演赛发布会在创新工场举行。李开复现场为龙之队加油助威,龙之队队长杜悦也表示虽然胜机仅有百分之10,但是仍将全力以赴,赛出水平。 [详情]

德扑人机大战蓄势待发 智力运动馆将见证传奇
德扑人机大战蓄势待发 智力运动馆将见证传奇

  4月6日至10日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南智力运动馆打响,中国的六位牌手将向德州扑克人工智能“冷扑大师”发起挑战,新浪将全程跟踪此次事件,为您带来第一现场的消息。 德州扑克 扑克游戏里的“围棋” 围棋是棋类游戏里变化最为复杂的,经常有人说下了围棋之后,对其他棋类就不感兴趣了。德州扑克在扑克类游戏,或者说非完全信息博弈游戏里,也是这样。有位德扑圈的高手以前酷爱麻将,但自从接触了德扑之后,就再也不打麻将了。 德州扑克基本规则很简单,玩家在发牌过程中依次投注,最终河牌时比较大小。和公共牌组成牌面大的一方获胜。但简单的规则,加上隐藏的信息,这个游戏却散发着无与伦比的魅力。在数学家眼里,她是一个超级经典的博弈模型;在牌手眼里,她是一个气运技术并存的“潘多拉魔盒”;在程序员眼里,她是人工智能需要挑战的另一个难关。 以下是德州扑克基本牌型的大小。 德州扑克牌型大小 规避运气因素:36000手牌 复式发牌 毫无疑问,德州扑克是有运气因素的,因此在竞技时如何规避运气问题,是公平与否的重要环节。本次人机大战,双方将在5天的时间里,打36000手牌。这个数量看似不少,但并不足以完全规避运气带来的影响。 比赛还采用类似桥牌开闭室规则的复式发牌打法,两位牌手为一小队,拿到的手牌分别是队友对手电脑的手牌。例如,队员甲在这幅牌里赢下来100分的筹码,但队友输给了电脑200分,那么这副牌人类牌手是输了100分。最终计算的也是三组牌手的总分,而不是某个牌手的胜负。 六位牌手当中很可能会出现某位“牌运”较强的选手,个人积分取胜,而团队落败的。这也是为什么说人类还有一丝胜利希望的原因所在。 新浪网、微博全程关注 从4月6日开始,新浪体育、新浪科技、新浪微博将全程关注本次德州扑克人机大战,5天德扑人机大战具体比赛日程安排如下: 上半场对决,08时至13时 下半场对决,16时至21时。 4月10日晚上还安排了名人挑战赛,李开复等跨界德扑高手也将上场与冷扑大师一较长短,敬请关注新浪体育的相关报道。 (新浪体育周游 发自澄迈)[详情]

人机扑克是什么:Libratus人机扑克介绍
人机扑克是什么:Libratus人机扑克介绍

  人机扑克是什么: Libratus 是一个玩无限德州扑克的人工智能程序。Libratus的策略并非基于专业玩家的经验,所以它的玩牌方式可能有明显的不同。基于在匹兹堡超级计算机中心大约 1500 万核心小时的计算,它使用算法分析德州扑克规则,解决AlphaGo也无法处理的不完美信息,从而建立自己的策略,而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步。 研究背景: 扑克智能程序前身:2016年卡耐基梅隆大学(Carnegie Mellon University,以下简称CMU)一位Tuomas Sandholm教授曾领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中惨败。这也是Libratus的前身。2017年Libratus由Sandholm 教授联同另一位Noam Brown博士开发完成,Libratus的水平提升基于数个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。 操作难题:不完整信息博弈早已被证明是难以攻克的计算机难题。对此,CMU 的人工智能研究者们专注于信息集,通过同时思考未知和已知变量各种可能状态的方式来进行预测,这需要强大的计算能力。 计算技术:Bridges Super Computer超级计算机。每个牌局结束后的夜晚,匹兹堡市超级计算中心Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略,Bridges提供三种类型的计算选项,称为节点:常规、大型和超大型。Bridges不是当今世界最大、最快、最强劲的超级计算机,但它可能是面向公众开放的,最大、最快、最强劲的超级计算机,在Bridges的帮助下,原本在个人电脑上耗时数月的计算,仅仅几个小时就搞定。 技术应用:没有用到专业的牌局进行神经网络的训练,不同于AlphaGo用了大量的棋局做训练,这个模型用的是随机生成的牌局(随机产生公共牌、底池筹码、玩家拿牌概率)和尝试性的动作带来的结果(在随机生成的输入情况下模拟玩家跟牌后的结果)作为训练数据。Libratus 还利用了博弈论,与AlphaGo不同,Libratus系统不通过分析大量可能的下一步完成任务,这个 CMU 构建的新系统通过平衡风险与收益来决定自己的下一步,在纳什均衡定义中的完美游戏状态。 对外赛事: 2015年,CMU曾组织了首场“大脑对抗人工智能”赛事。在当时的赛事中,代表CMU出战的是另外一款人工智能系统,同样是由Tuomas Sandholm教授开发的“Claudico”。有四名职业扑克玩家参加了比赛,当时扑克职业玩家与Claudico仅进行了8万手牌的比赛。然而,Claudico并未获得最终胜利。 2016年11月初的四周里,由阿尔伯塔大学开发的DeepStack 击败了 11 位德州扑克职业选手中的 10 位,统计上,赢的优势很大,与每位对手玩了 3000 手。 美国时间2017年1月30日,在宾夕法尼亚州匹兹堡的Rivers赌场,CMU开发的 Libratus 人工智能系统击败人类顶级职业扑克玩家。据官网介绍,此次比赛共持续 20 天,由四名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,最终AI赢得了176万美元 。 未来发展: Libratus在德州扑克人机大战中获得最终的胜利,是人工智能领域的巨大成就。玩德州扑克需要推理能力和心理战术,而这对于机器来说很难模仿。在围棋界纵横无敌的DeepMind AlphaGo本质上处理的还是完美信息博弈,无法处理德州扑克的不完美信息问题,更遑论使出诈唬(Bluffing)。Libratus在面临不完全或误导信息时,有进行推论的能力。现实世界中,不完美信息才是常态,各种看不见的隐藏信息产生了大量的不确定性,而德州扑克代表的就是这种类型的博弈。 未来Libratus这样的AI,可以用于商业谈判、网络安全、医疗方案制定等领域。人工智能发展的终极目标,是通用人工智能(AGI)。通用人工智能可以解决任何一个问题,而不是像Libratus或者AlphaGo这样只能专注于扑克或者围棋。想要实现AGI就得让人工智能学会解决不确定性问题,这也是此次人机大战的重大意义之一。 2017.1.30 Libratus和四位选手比赛数据   2017.1.30四位职业扑克选手 CMU Tuomas Sandholm教授 2017年1月匹兹堡赛事现场画面 [详情]

李开复:冷扑大师情商高 10%胜率远超围棋人机
李开复:冷扑大师情商高 10%胜率远超围棋人机

   北京时间4月5日上午,冷扑大师VS中国龙之队人机扑克巅峰表演赛赛前发布会在北京创新工场举行。创新工场CEO暨人工智能工程院院长李开复博士联手中国龙之队队长杜悦在现场答记者问。以下为相关采访。 记者:在AlPhaGo之后机器击败之类的事情已经不奇怪了,这次德州扑克的AI比赛,你希望哪些东西被关注到? 李开复:从纯AI科技领域来说,胜负不是最重要的,最终一定是电脑打败人类,我们可以为杜老师的团队加油。最重要的是两件事情,第一是AI的能力,AI的能力不仅仅与聪明的搜索,很大的搜索空间,像AlPhaGo这样。而且在很多未知的因素之下做判断和推理,同时我们可以把AlPhaGo理解为高智商的,但是冷扑大师是高情商的,而且这样的技术是可以在很多商业的领域里面达到应用,因为大部分人类的信息都不是彼此公开的,因此让更多的人了解AI的时代来临了,应用是众多的。另外对于科技一点的人来说,其实冷扑大师并不用深度学习,当我们都在位深度学习疯狂找各位应用的时候,我们要了解深度学习即便很伟大,有很多应用,其实才是刚刚开始,未来我们会有更多的科学家发明更多的技术,让AI给人类带来更多的价值。 中国龙之队队长杜悦 记者:你们团队有很多德扑玩的很好又懂计算机的专家,你们现在有没有针对冷扑大师有大概性的策略? 杜悦:第一我们做了很多准备,在小长假过程当中,龙之队的队员都在北京做团队的讨论,所以我们准备工作做得非常充分。第二基于我们对于人工智能对于AI的了解,我们相信虽然说这次冷扑大师是AI在德扑领域的巅峰之作,应该是取得了非常大的进步,非常大的成就,但是离计算机科学和人工智能能够达到的理论水平,还有一定的距离。它这个点是不是已经超越了一般的德州扑克高手,我们这次可以验证一下,就像李开复老师讲的,人工智能超越人类这是迟早的事情,不是这一次就是下一次,我们只是希望有一个小小的梦想和愿望,希望中国龙之队是最后一次能够战胜人工智能的团队。 记者:这次的表演赛为什么选择在海南而不是在北京、上海、深圳这样的人工智能发展相对好一点的城市呢? 李开复:我们在北京会做各种的直播,包括这次记者会,所以其实现在互联网已经连接了全世界了,在哪里比赛倒不是至关重要的,经过直播和记者会,当场跟大家讲解,我觉得在海南跟北京差别不是很大。但是我们也深深认为海南作为一个空气特别好,很好的创业环境,能够请一些国外的高手和队员看一看,会让我们大开眼界,有一些人可能觉得创业可以在海南做,有一些人可能决定在那边度假,教授已经拿着泳装问我那边的天气怎么样。 记者:人工在策略博弈和逻辑推理方面的作用。 李开复:不排除有运气成分,就像我跟杜老师打牌也不是每次都输给你,也偶尔赢一次,有这个概率的存在,但是两件事情可以把随机因素降到零,第一次打够多牌,我们这次打36000手牌。第二刚才打的复试机试,我跟Anita是一个队伍的,陈杰跟杜悦是一个队伍的,我拿到了AA,他拿到了二七,这样我赢的概率非常大。但是怎么把这个消灭掉?我的队友跟陈杰打的时候,一定程度把运气对冲了,经过这两件事情运气会被降到非常低,作为CMU的教授,已经打败了美国顶尖的牌手了,为什么不像深蓝封牌了不打了呢?他觉得还可以打一场,因为他觉得有足够多的信心可以胜出。我们做科研的不太相信外国瑞士法院,他们要懂让他们发明AI好了。 杜悦:我只是补充一点关于德州扑克,德州扑克运气成分非常大,这也是为什么德州扑克家喻户晓、广为流行,大家参与度非常强的重要的原因。一定是技术水平高的选手能够获胜。 记者:问一个问题,德州扑克作为棋牌的一种,有天然的体育属性,如何看待中国体育产业的发展。 李开复 李开复:体育尤其是从智力和体力的体育,都是很重要的,虽然未来人工智能时代来临,人有更多的时间,把这个时间放在智力和体力的运动是非常好的事情。对于智力、体力的投资,我们也有投资,我们也会看这些方面的投资机会,看到看得更多的是体育型的多一些,投了悦跑圈。如果说创新工场跨领域,最多是人工智能,这个领域里并不会看。这次冷扑大师组了一个公司,我们没有计划投资这个公司的,我们还是要看到人工智能公司能够快速产生巨大的商业价值,无论打得多好,还是相对小众的,我们看人工智能、文化娱乐、互联网金融、教育、B2B,也看一些体育方面的,我们不会投资太多,但是还是观看。 记者:像对于降低波动性来讲,有很多的方法。从限注和发多次牌或者说保险,为什么你们这次要采取直接按照概率进行?过度的为了降低波动性更改规则,是不会对人类选手的发挥影响,第二没有反转的德州扑克能算德州扑克吗? 杜悦:第一个问题为什么采用按概率的来降低运气的含量,记者朋友提到了好几种方式,比如说保险、限注,这些方式理论上来讲都没有体现对于期望值的评估。德州扑克长远而言打的是期望值,任何运气成分能够带来更多的刺激和体验,并不是一种技战术水平的准确的反映。这次人机大赛主要衡量机器人人工智能跟人类的选手技战术的水平,要尽量尽力运气成分。 记者:冷扑大师不是基于深度学习,而是基于博弈论,大家知道这轮人工智能的发展为什么是基于深度学习,因为深度学习让机器可以自我发展,像这次36000手牌的核心,我们看到不是让机器去不断的根据前面的战局完善自己,而是因为博弈论降低波动性,这样意味着他的概率在里面,不会随着时间的成长而让AI的提升像深度学习那么明显,而是说AI的提升还是基于程序员在背后做修改,而不是基于不断的持续的对战,您怎么看待AI的发展的趋势和未来?有没有可能和深度学习结合起来? 李开复:有关技术不要认为博弈论就是一个人工的编程,里面是有非常多的机器学习的成分,有两种不同的策略,都会学习和进步,而且上次跟美国高手对决之后,有在继续的学习,这次也会在每一次的半天比赛之后启动机器学习让它进步,绝对不是一个死的编程的东西在里面,博弈论是运用的方法,实际的学习还是机器学习,CMU的这位教授是美国人工智能世界TOP10之一。和AlPhaGo的深度学习的差别,创新工场有一位员工是曾经看过AlPhaGo的代码的,里面肯定不止是深度学习,有各种跟围棋相关的东西,即便发表的论文里面,也是深度学习和(英文)的配合,做好任何一个高端的AI软件,不能完全靠一种技术,AlPhaGo是至少三种的结合,我们相信冷扑大师现在发表的是两种,但是实际上可能有三四种不同的经过学习和成功失败、对手来做调整。另外对于个人也会有学习,比如说跟杜老师打的,慢慢的就会形成不同的数据,彼此对应的打法,智能还是挺强的。 记者:开复老师提到概率,德扑人类战胜人工智能的概率不到10%,是如何得到的? 李开复:我觉得我是凭两件事情,第一个毕竟这次的表演赛不如上次的对决那么长,这次是36000手牌,上次是12万,从12万降到36000手运气成分会增加一些,人类的机会会有一些。第二靠一批不懂计算机的人凭拍脑袋决定该怎么调整自己的策略,一定不如龙之队有这么多的学霸,如果纯一对一的比,龙之队不见得打得过美国的四个人,但是经过深度的思考研究,对于计算机的理解应该是有胜率的。我大胆的相信了杜老师的10%的预测。 记者:我们抱着必败的心理参加比赛了,这有什么价值? 李开复:10%挺高的,大家赶快来观看人类还有10%的机率,AlPhaGo对于柯洁是完胜。 杜悦:10%是我原创的,经过李开复的宣传广为人知,如果需要任何人承担10%,大家可以来找我。[详情]

视频-李开复:德扑人机10%胜率不低了 围棋人机是0
视频-李开复:德扑人机10%胜率不低了 围棋人机是0

   4月5日上午,冷扑大师VS中国龙之队人机巅峰表演赛发布会在创新工场举行。本次比赛策划人-创新工场COE李开复携手龙之队队长杜悦现场回答记者提问。被问到这次德扑人机战的意义,李开复回应道:“德扑百分之10的胜率不低了,你要是AlphaGo来,柯洁和它比的机会是0。所以大家要珍惜这百分之10,来关注德扑人机战”。 以上为相关视频。[详情]

高清-德扑人机大战赛前发布会 李开复亲测人机战
高清-德扑人机大战赛前发布会 李开复亲测人机战

  [详情]

CMU对话德扑AI团队:解密1+2架构 不攻反而不败
CMU对话德扑AI团队:解密1+2架构 不攻反而不败

  文章来源:微信公众号 量子位 放下想赢的执念后,AI赌神再没输给人类。 这个AI赌神拉丁名Libratus,中文名冷扑大师。今年1月,它在美国战胜四位顶级人类德扑玩家,赢得176万美元(虚拟货币)。 如今冷扑大师应创新工场李开复的邀请,来到国内,将与6位龙之队高手展开六天鏖战。 为此几天之前,量子位前往美国宾州匹兹堡卡内基梅隆大学(CMU),独家对话Libratus的两位创造者:Tuomas Sandholm教授和他的博士生Noam Brown。 这两位人工智能领域的杰出学者,向量子位讲述为何Libratus能在扑克人机大战中战胜了人类,这套强大的系统到底基于什么架构、什么技术,又是如何训练、成本几何…… 推倒重来 春天的匹兹堡,时晴时雨,温度变化剧烈。 走进卡内基梅隆大学Gates-Hillman Center,位于九层的Tuomas Sandholm教授办公室非常显眼:门口张贴着一张今年1月德扑人机大战的红色海报。 △ 办公室门口的海报 “开战之前,我完全不知道结局会怎么样”,Sandholm用带着芬兰腔的英语说,当时他感觉五五开,但Libratus的胜算稍大一些。不过线上赌博网站可不这么看,他们开出大约1:5的赔率,认定Libratus也将倒在匹兹堡的河流赌场里。 也将?没错。Libratus不是凭空而生,2015年4月它的前身Claudico正是在同一个赌场里,败给四位人类高手。当年Sandholm也认为有五五开的胜率。 2014年8月,刚刚完成硕士学业的Noam Brown继续留在CMU攻读计算机科学的博士学位。当年,他和老师Sandholm一起开发出德扑AI:Tartanian7,以及后续版本Baby Tartanian8。并且连续赢得电脑扑克大赛的冠军(电脑对抗电脑)。 如同外界所期望的那样,他们开始推动德扑人机大战。 在两年前那次时长两周的人机对抗中,Claudico累积输掉73.2万美元(当然也是虚拟货币),和四位人类顶级玩家交锋8万手。 2017年1月11日,全新的Libratus卷土重来。还是四位人类对手,不过时长变为20天,累积交锋12万手。这次德扑AI没给人类玩家机会,一路以碾压的态势豪取胜利。Libratus对四位人类高手的领先优势是:14.7个大盲注/百手(14.7bb/h)。 “一般领先5-10bb/h就肯定是赢了”,Brown对量子位说。 从完败到完胜,Claudico经历了哪些提升,才得以成长为Libratus?对于这个问题,两位开发者的回答是:Libratus不是迭代而来,而是推倒重来。 一个全新的德州扑克AI。 看不透的高手 在德扑这件事上,Libratus没有师父。 Sandholm和Brown只告诉AI基本的德州扑克规则,然后Libratus就开始通过“左右手互搏”的方式学习这个扑克游戏。和AlphaGo不同,在人机大战之前Libratus没有研究过人类如何打德州扑克,也没有和人类职业玩家有过交手。 在投入实战之前,Libratus自己对战了几百万手牌,其中有不少是带有特定目的的残局,真正机器和机器之间的交手,大约是几十万手。 所以,AI形成了一种与人类迥然不同的牌风。 “在德扑比赛中,顶级高手会尝试寻找对手的弱点,并展开攻击”,创新工场AI工程院技术VP李天放说。李天放既有技术背景,也是一名德扑高手。 Dong Kim是今年1月德扑人机大战中的一位人类选手,这位28岁的韩裔美国人回忆说,每一天Libratus都会进步,人类选手很难找到它的弱点或漏洞。即便找到一个,第二天就会消失不见。这让他感到绝望。 但也许他根本就感觉错了。“有人类玩家说找到了漏洞,其实不一定”,Brown对量子位说:“这可能是Libratus的一种战术,去搅乱对手的策略”。 △ Brown身后是他的电脑 不能用人类的思维去衡量AI。让Sandholm记忆犹新的是,1月的德扑人机大战进行到尾声,当时AI早已遥遥领先,所有人都认为Libratus会趋近于保守。 “但它反而越来越激进”,Sandholm说特别是最后几局,非常出人意料。 比方,为了一个很小的底池推了All in,或者下注额只有底池的十分之一。“有时候Libratus的策略会被认为是臭手”,但事后复盘Sandholm说这个德扑AI尝试了很多令人叫绝的方法,其中包括各种策略的诈唬。 诈唬也不是人教的,而是机器自己学会的。 怎么学?“诈唬是特别重要的技能,系统在学习中发现,如果有一手烂牌,直接诈唬能赢更多,所以它就学会了”,Brown告诉量子位。 “这就是AI特别奇妙的地方”,Brown坐在自己CMU标配的上一代Aeron座椅上说,“很多人看到Libratus能诈唬,觉得很了不起”,但在这位博士的眼中,诈唬这种看似与心理有关的人类技能,机器是可以通过算法学会的。 打开AI的大脑 为什么Libratus能比前代更厉害,进步在何处?Brown举了两个例子。 比如,对于K-High Flush(最大牌为K的同花)和Q-High Flush(最大牌为Q的同花),这两手牌对于Claudico来说是等值的,而Libratus则会做一个精确的区分。实际上,Libratus会对每一手牌进行单独的处理,根据不同的牌面制订出不同的战略。 再比如,对于250元的下注,是当成200元还是300元来计算?那么249或者251呢?实际上,Libratus不会尝试聚类,而是马上实时计算,得出胜算最大的策略。 △ Sandholm讲解冷扑大师 Sandholm则从全局的角度,打开Libratus的大脑,向量子位逐一讲解了构成这个扑克AI的三个主要模块。其中一个用于赛前,两个用于赛中。 模块一:Nash equilibrium approximation before competition(赛前纳什均衡近似) 这个模块把最重要的博弈信息进行抽取,比如针对某一手牌对应的战略,然后再应用强化学习等方法,继续寻求提高和改进。这里使用了一个新的算法:蒙特卡洛反事实遗憾最小化。在这个模型的帮助下,Libratus自己学会了德扑,而且比以前速度更快。 模块二:Endgame solving(残局解算) 这是Libratus最重要的部分,Sandholm说。实际上Claudico也有这个模块,但那个版本几乎不起作用。而新的版本不会再给对手留下漏洞,这个过程不断进行,对手新出一招后,会继续展开新的残局解算,这被称为Nested Endgame Solving。 德扑这类不完美信息博弈,不能拆解为可以独立解决的子博弈。所以Libratus采用的残局解算的方法应对,想进一步深究,可以查看Brown和Sandholm的论文。 模块三:Continual self-improvement(持续自我强化) 比赛中人类高手会寻找Libratus的漏洞,并展开有针对性的攻击。这个模块的作用就是发现问题所在,找到更多细节进行自我强化,然后得到一个更好的纳什均衡。 “三个模块都用了新的算法”,Sandholm说第一个模块的新算法能够抽取更多的细节,而且比原来的算法更快;第二个模块的算法是全新的;而第三个模块则有一个全新的理念,有点类似于:防守是最好的进攻。 Libratus不再寻求发现并利用人类对手的漏洞,相反,这个AI开始观察人类发现了它什么弱点,然后有针对性的弥补和提升。于是Libratus的弱点越来越少,直到人类玩家沮丧的发现,想要赢下比赛变成一件几乎不可能完成的任务。 不主动进攻就很少露出破绽,李天放说跟Libratus对战就像打一堵墙,最好的结果可能就是打个平手,基本不可能获胜。纳什均衡本身,追求的就是一种平衡。 Libratus是一个防守大师。 深度学习不是唯一 与围棋大师AlphaGo相比,Libratus有很多不同之处。其中就包括:Libratus并没有使用目前相当火热的深度学习技术。 “深度学习是个非常好的技术,但我们没有在这个项目应用,是因为深度学习不能给出绝对的保证。比方识别猫的图像,对于给定的图片能得出95%是猫,但也不是绝对的保证,而我们的算法,能够保证最优异的结果”,Sandholm说。 当然也有团队在用深度学习来搞德扑AI。 来自加拿大阿尔伯塔大学、捷克布拉格查理大学和捷克理工大学的研究人员,基于深度学习技术开发出德州扑克人工智能DeepStack。 对于两个德扑AI来说,还没有更好的比较方法,目前只能说Libratus击败的对手,要比DeepStack的对手水平更高。其他这里不展开讨论了,这个团队也发表了相关的论文。 “对这一类型的任务,我们的方案比深度学习更好”,Sandholm对量子位表示,目前深度学习的方案实际上没有解决问题,而Libratus这个系统“时间越长,越能接近完美”。 对于这个问题,我们询问了CMU机器学习系的邢波教授,他指出还不应过早的下结论说:深度学习就是机器学习的未来。 “Sandholm教授其实不是做深度学习的,他用的方法实际上被认为是是传统的AI,但是可以达到这么强大的功能”,邢波对量子位表示这是一个有力的证明:人工智能并不等于深度学习,很多新的方法需要探索和了解。 技术的争论还需更多的时间。 △ CMU校园一角 其实对于Noam Brown来说,研发Libratus的过程中“最难的问题,是必须有一个全局的观念。但这是个庞大的系统,需要从计算和解决问题的角度考量,而不是仅从博弈的角度。在这个过程中,怎么把问题描述出来,是最大的挑战”。 而Tuomas Sandholm来说最大的挑战,就是只两个人,要干所有的活儿。 成本几何 包括杜悦(龙之队队长)在内,都很关心Libratus的成本。 成本背后关联着诸多实际的问题,例如距离实际应用还有多远,或者距离人工智能毁掉德州扑克这个游戏还有多久。 应量子位的要求,Brown估算了一下说:想要运行Libratus,最低只要50个笔记本就够了。他进一步解释说,一对一的无限注德扑比赛,每手需要50个CPU进行运算。暂且不管响应速度如何,至少已经能够完成计算。 “这个算法还可以被优化,而且计算硬件的提升,未来我觉得手机可能上就能运算”,Brown估计说可能五年内一部手机就能搞定一切了。 而对于他的老师Sandholm来说,成本计算要复杂得多。 首先他把这看成一场为期13年的挑战,之前所有的探索和努力,才最终成就了今天的Libratus。Sandholm估计过去这些年,仅支付给学生的工资就得有1000万美元。而Brown只是诸多学生中的一个。 其次具体到Libratus,眼下主要是运行成本。 运行这个德州扑克AI赌神,需要匹兹堡超算中心的Bridges超级计算机。今年1月人机大战之前,Libratus在超算上的训练成本是1500万核小时(core-hour),比赛期间耗用1000多万核小时,总共耗用1900万核小时计算资源。 “我们用的服务器有28个核,所以一个服务器运行一小时就是28核小时,如果在亚马逊云服务上大概要1-3美元”,Sandholm说他们一共用了上百台服务器。 △ Nystrom介绍匹兹堡超算中心 匹兹堡超算中心高级研究总监Nick Nystrom向量子位证实,Libratus使用了150台服务器。但由于是研究型项目,Sandholm其实并不需要支付费用。 对于笔记本上运行Libratus的可能性,Sandholm笑称可以搞一套简化系统装在笔记本上,但也只能变成一个有趣的小培训。无论如何,Sandholm表示普通人“想要使用这套系统肯定不容易”。 与之相比,DeepStack的训练使用了175 个core-years。不过据说DeepStack在比赛期间,只需要一台笔记本就够了。 未来何往 德扑AI的牌技还能更好么? 当然,Sandholm说肯定存在进步空间。杜悦很关心Libratus距离扑克之神还有多远,何时能达到GTO(博弈理论中的最优化策略)。 对于这个问题,Brown猜测Libratus与GTO之间的差距是15bb/h,而Libratus本身的牌技可以提升到50bb/h的水平。而Sandholm则说“没人知道Libratus能走多远”。Brown坦言他不会再对这个德扑AI进行优化,他正面临博士毕业的选择。 现在这个德扑AI只能玩一对一的德州扑克,尽管可以同时处理多场,每场也只能是一对一。还会做一对多的升级么? △ Sandholm与量子位交流 “我们有一些想法”,Sandholm告诉量子位,目前Libratus基于的纳什均衡理论,主要针对两个人博弈的情况。“如果变成三个人博弈,纳什均衡理论是不是适用,现在我还不是很清楚”,Sandholm说多玩家系统,第一个模块如何界定是个难题。 不过仅仅是一对一的德扑AI,也有相当的商业前景。 “现实世界充斥各种不完美信息博弈,例如企业之间的商业谈判,网络安全,医疗方案的制订等”,Sandholm正考虑如何进一步释放Libratus的能量。 “我最喜欢的商业用途当然是商业谈判,可以通过人工智能来实现在最合适的时间,以最合适的价格找到最合适的供应商”,卡内基梅隆大学计算机科学学院Andrew Moore院长近日接受腾讯科技/新浪科技采访时,这样展望Libratus的未来。 现在Sandholm教授已经拿到NSF(美国国家科学基金会)一笔为期三年的新投资,用以资助他继续基于Libratus展开相关研究。现在Sandholm教授也在推进一项针对T细胞的医疗研究,把癌细胞注入小白鼠,看看他们的治疗方案是不是正确。 无论未来Libratus如何,Sandholm会继续在博弈的道路上前进。 Sandholm已经在人工智能和自动谈判领域,研究超过28年。他在这方面最早的成绩,还要追溯到1989年前后,当时他做了一套自动为卡车司机谈判并分配任务的系统。 比赛看点 最后,再聊聊即将开战的冷扑大师vs龙之队。 对于这场比赛,李开复日前在IT领袖峰会期间表示,龙之队的胜算为10%。不过,Sandholm眼中这个概率只有5%。 “战无不胜”,Sandholm现在用这四个字形容Libratus。在他看来,德扑AI的水平在人类最好的玩家之上。 但为什么还是给出5%这个数字呢?他的理由是:这次的对抗只打36000手。 “几乎可以肯定人类有机会赢。而且会有蛮大的机会可以赢。双方博弈的手数越多,强大一方获胜的可能性越大;手数越少,弱小的一方获胜的可能性越大”,Sandholm说。比如只打一手牌,双方不论实力差距多大,弱小的一方都有50%的机会能赢。 △ Sandholm坐在电脑前 除了胜负,这场对抗还有什么看点呢? 第一,德州扑克是不完美信息的博弈,跟跳棋、围棋等比赛完全不一样。有很多你无法想象的要素,都会影响赛局的结果。 第二,整个博弈是诈唬、下注等环节的完美平衡,冷扑大师需要应用这些手段,让对手完全无法推测自己手上持有什么牌。 第三,冷扑大师会有非常不同寻常的下注,是德州扑克中从来不会出现的大注和小注,也会搞donk betting,即反主动下注。最后这个德扑术语的意思是,原本跟注的玩家在下轮牌发出来后抢先下注。 “这个德州扑克AI并不会线性发展,可能在下一手牌的时候,突然变得非常冒进”,Sandholm对量子位表示。 所以,拭目以待吧。正如开头那段视频所说:“冷扑大师,来了”。[详情]

不要被这个妹子的外表骗了 她可能是……
不要被这个妹子的外表骗了 她可能是……

  对职业牌手来说,每一场德扑比赛就像一次深思熟虑的投资;对投资人来说,每一次投资就像一场全心投入的德扑比赛。 不确定性是德扑或者说非完全信息博弈游戏最大的魅力。在德扑的牌桌上,笑到最后的可能不是所谓职业牌手,世界排名第一的某某,而是一位面容和蔼的大叔,一个笑容甜美的妹子。 笑容甜美的朱亚希 朱亚希就是对面那个甜美笑容的妹子,但姣好容颜下,隐藏着的却是不折不扣的“巨鲨”。在德州扑克的牌桌上,把菜鸟比喻成“鱼”,而隐而不露的高手则是“鲨鱼”。 朱亚希是江苏常州人,一个非典型的90后,2012年毕业于浙江大学金融与工商管理专业,在一家咨询公司任职。当时,朱亚希接触的主要客户都是创投圈的,德州扑克是大家交流、休闲的重要方式,她也学会了德扑,并渐渐发现了自己在这项游戏上的天赋。 朱亚希成为PokerStars签约牌手 随着朱亚希参加的比赛越来越多,取得的成绩越来越瞩目,2015年,她被PokerStars扑克之星明星队选中,成为中国大陆首位签约的牌手。这既是对她精湛牌技的认可,同时也是对她明星范儿的肯定。 2017年,朱亚希加盟中国龙之队,将与其他五位队友一起挑战德州扑克人工智能“冷扑大师”。围棋和德州扑克可以说是检验人工智能最好的模型,两者的规则都简单明了,前者让计算机尝试处理无限的可能;后者让人工智能学会读懂“人心”。 这次人机大战对人类牌手会是极大的考验 虽然这次比赛被定义为“表演赛”,整体宣传的主题也是人类和人工智能共同发展,但不可否认的是,胜负显然会成为人们最关注的事情。杜悦、许朝军、张淮、童舟、朱亚希、王天健,这六个名字将连同这次比赛结果一起写进历史。 中国德州扑克龙之队 一个新的时代可能就就要来了,你,准备好了么? (白夜)[详情]

德扑AI背后专家:人机战不靠深度学习 靠“谈判”
德扑AI背后专家:人机战不靠深度学习 靠“谈判”

  周峰 冷扑大师没有使用深度学习,这多少有点风水轮流转的意思。 4月6日,在美国击败人类顶尖德州扑克选手的人工智能Liberatus接受创新工场邀请,化名“冷扑大师”,将在海南挑战中国职业德州扑克选手组成的“龙之队”。赛前在接受新浪科技专访时,开发冷扑大师的卡内基·梅隆大学计算机科学学院院长安德鲁·摩尔(Andrew Moore)揭示了在另一场人机大战中,战胜人类背后的基本原理:更加古老的线性规划(Liner Programming)。 在解决面对不完整信息,获得最佳策略的问题方面,线性规划早就已经成为重要方法。在微观经济学和商业管理领域当中,这种算法已经被大量应用在降低生产流程成本。而在人工智能领域,它和深度学习火热之前的主流:贝叶斯网络技术息息相关,而后者也是目前互联网的通用基础技术之一。 2017年1月11日,职业扑克选手贾森·莱斯(Jason Les)在与Libratus较量德州扑克。1月30日,卡内基·梅隆大学开发的人工智能结束了与4名顶尖德州扑克选手之间的比赛,取得胜利。 在采访开始前,摩尔表示,德州扑克游戏中包含了大量的隐藏信息,在本质上就是一种谈判。而通过人工智能谈判其实是卡内基·梅隆大学研究团队的初衷。他表示,赢得扑克游戏胜利能让人感觉人工智能非常厉害,但他也很期待人工智能能够在协商谈判并解决问题方面涌现出更多应用。 以下为部分采访实录,新浪科技整理: 新浪科技:冷扑大师好像和AlphaGo不一样,没有从人类玩牌的结果中学习。德州扑克人工智能和围棋人工智能有哪些不同? 安德鲁·摩尔(以下简称AM):扑克是一个规则非常简单的游戏,但是有很多隐藏信息,而围棋没有隐藏信息,所以做围棋方面的人工智能,需要进行非常深度的棋谱搜索。而做扑克游戏的人工智能要面对的问题是有非常多的诈唬策略要一一考虑。 新浪科技:冷扑大师有没有使用到神经网络和深度学习技术? AM:冷扑大师没有使用神经网络和深度学习方面的技术,而是使用了最为传统的线性规划(Liner Programming)。 我可以讲得稍微细一点。计算机需要算出最合适数量的诈,因为无论诈数量过多或者过少,都可能被其他牌手利用。数学家约翰·纳什曾经计算出的一个等式来解决类似的问题,但是要想真的计算出最合适数量的诈,这个等式可能会有无数的变量,而我们在冷扑大师身上应用的计算机技术可以得出最接近正确答案的解决方式。 新浪科技:李开复之前写过自己玩德州扑克的感受,他说想要玩好,就要把人性摆在一边。冷扑大师在比赛时是靠算牌,还是用统计方式研究对手打心理战? AM:算牌是赢牌的正确方式。不过这样做的计算量很大,冷扑大师需要完成1000万小时的计算才能形成它的策略。 但用统计数据来研究对手玩法不是一个好办法,因为一旦我知道你在统计我的玩法,我就会故意使用变换押注方法,实际上可以绕开你。 所以就像我刚才说的,冷扑大师没有使用心理战赢牌的企图,只是使用数学方法而已。 实际上过去十年是大数据和机器学习发展的十年。但冷扑大师所用的线性规划与这两者有很大不同,它是实现最优解(Big Optimization)的技术,相信未来的技术前沿也是实现最优解的技术。 4月6日,6位华人牌手组成的中国龙之队将在海南挑战Libratus。但队长杜悦(左四)表示,龙之队的胜算可能只有10%。 新浪科技:和龙之队比赛的赛制,与常见的多人德州扑克牌局不同。为什么会选择一对一形式的比赛?是和算法限制有关吗? AM:德州扑克中最考验牌手技术的反而是双人对战,如果有更多牌手的话,其他牌手间的技术差别反而会被利用。 新浪科技:除了德州扑克之外,冷扑大师所采用的技术还可以用在哪些领域? AM:我最喜欢的商业用途当然是商业谈判,可以通过人工智能来实现在最合适的时间,以最合适的价格找到最合适的供应商。 谈判其实是非完整信息博弈理论中一个不错的例子,因为谈判的时候,我们不一定会透露真实的想法。我们的研究人员认为计算机能够与人类或者其他计算机进行交谈和谈判的能力非常重要。计算机的这种能力就是我们下一个研究方向。 实际上,除了德州扑克之外,相同算法还可以帮助很多需要器官移植的人,比方说Kidney Exchange。在美国,这个算法每年能帮助数百位患者实现肾脏移植的匹配。 新浪科技:所以冷扑大师背后的技术实际上是通用的。 AM:冷扑大师所采用的技术确实可以应用到其他领域,来帮助人类找回丢失掉的信息。比如购买一间公寓,这就是一个谈判过程。如果我聘请的人类房产中介直接告诉卖家我愿意出多少钱买他的房子,那我肯定马上炒他的鱿鱼。因为他的工作就是在隐藏我信息的前提下,和卖家达成交易。 新浪科技:怎么看待中国的人工智能市场?对人工智能开发者有什么建议? AM:从投资数量上能看出中国人工智能市场的发展是多么欣欣向荣。这是非常明智的投资,因为各行各业的自动化是未来经济增长的强劲动力。 但是,我认为一般意义上的人工智能技术工具,发展前景其实不大,而可以直接用于行业发展的人工智能才有真正的发展前景。我喜欢哪些可以将技术应用在已有行业的人工智能初创公司,而不是那些研发一般性技术供其它公司使用的企业。 就我个人来说,如果你的初创公司有可以帮助自闭症儿童快速学习的人工智能技术,那我就会有非常强烈的兴趣。而如果你的公司有可以让机器学习更加准确的技术,那就不是很好了。 2015年,创新工场CEO李开复获得卡内基·梅隆大学授予荣誉博士毕业前,与安德鲁·摩尔(右一)的合影。 新浪科技: 2015年卡内基·梅隆大学有将近50名科学家陆续被Uber挖走。而人工智能领域的顶尖专家加入企业也是目前的趋势。您对当前人工智能教育环境是否有担忧? AM:从2015年1月起,我们新录用了26名教职员工,而只有4个人离开。目前匹兹堡(卡内基·梅隆大学所在地)也已经成为了全世界的自动驾驶技术中心。科研专家加入企业看似是个问题,但这反而对大学和匹兹堡都有利。 实际上,我在担任卡内基·梅隆大学计算机科学学院院长之前,在谷歌从事机器学习系统方面的工作。虽然我喜欢谷歌的工作,但我还是决定重新回到卡内基·梅隆大学,因为当今世界上最顶尖大学所从事的研究工作是极其重要的,也将决定21世纪的发展情况。而我所需要解决的一个问题就是,在一个人工智能已经实现商业化的世界里,大学可以扮演什么角色。 比如卡内基·梅隆在10-15年前就已经开发出了自动驾驶技术,那么下一步应该做什么?我们不想一直关注业界已经在做的事情,而是可以有哪些前瞻性的研究。 对于想离开大学的教职工,我不是劝留,而是鼓励他们这样做。其实开发冷扑大师的Toumas Sandholm就已经建立了一家公司,叫Strategic Machine Inc。。这家公司就是从卡内基·梅隆大学拆分出来的。大学会将人工智能应用在扑克上的技术授权给公司,公司再专注与不完整信息博弈的研发和商业应用。 对于新录用的人,我其实会建议他们在这里做4-5年的研究,加入业界工作上3年,然后再回来做5年研究,这才是应该有的职业生涯,二者都不耽误。[详情]

视频-德扑人机战访谈(下) 朱亚希:战机器出奇招
视频-德扑人机战访谈(下) 朱亚希:战机器出奇招

  3月29日下午,德州扑克人机大战中国龙之队杜悦、许朝军、张淮、童舟、朱亚希、王天健六位牌手做客新浪演播室,畅谈赛前感受。女将朱亚希分析中外牌手差别,中国人更喜欢互相交流,打牌时注重感觉;外国牌手则喜欢借助工具进行数据分析。与机器比赛和跟人打牌,策略会完全不同。 以上为相关视频。[详情]

视频-德扑人机大战访谈(上) 队长:胜机仅10%
视频-德扑人机大战访谈(上) 队长:胜机仅10%

  3月29日下午,德州扑克人机大战中国龙之队杜悦、许朝军、张淮、童舟、朱亚希、王天健六位牌手做客新浪演播室,畅谈赛前感受。队长杜悦坦言胜机只有10%,但人总要有梦想,万一实现了呢。 以上为相关视频。[详情]

朱亚希:中国牌手更注重感觉 VS机器要出奇招
朱亚希:中国牌手更注重感觉 VS机器要出奇招

   德州扑克人机大战将于4月6日至10日在海南进行。中国龙之队杜悦、许朝军、张淮、童舟、朱亚希、王天健六位牌手将代表人类出战。3月29日晚,六位牌手做客新浪演播室,畅谈赛前感受。女将朱亚希分析中外牌手差别,中国人更喜欢互相交流,打牌时注重感觉;外国牌手则喜欢借助工具进行数据分析。与机器比赛和跟人打牌,策略会完全不同。 专访牌手 主持人司文:三位先简单做下自我介绍 朱亚希:我开始是做咨询工作,经常接触一些投资人啊什么的客户,学会了德扑。2013、14年的时候国内也有了一些德扑比赛,取得了一些成绩,开始走上了这条“不归路”。这次能够加入龙之队,和其他五位非常厉害的队友一起比赛,非常开心。 王天健:我接触德扑比较早,02、03年就开始了。后来我创办了中国德州扑克第一个门户网站,中扑网,中间也陪德州经历了一个比较艰难的时期。现在看到德扑运动发展越来越好也是非常欣慰。 童舟外号 喜之郎 童舟:大家好,我是童舟,江湖人称“喜之郎”。我是在多外读书的时候接触的德扑,但回国以后工作比价忙,参加比赛不太多。大概是从去年开始参赛,取得了一些成绩。 主持人司文:这次比赛采用的复式发牌,大家有何看法? 王天健:我们当时参加的是亚洲杯(国家杯)的比赛,以战队的模式,采用复式发牌。这种方式可以把运气和随机性的因素最大的排除在比赛之外,是更为公平的竞技方式。 德扑女神朱亚希 主持人司文:问下亚希,我们中国牌手和外国牌手在打法上有何区别,面对AI时这些特点对我们更有利,还是会产生更多漏洞? 朱亚希:先说中外牌手的区别吧。外国牌手可能更依赖工具做一些数据分析,比如他们会做出一个程序来,帮助他们算,如何打牌收益率更高。国内的牌手曾侧重于现场的讨论,交换一些现场的感觉啊,更注重一些抽象的东西。国外的牌手线上打牌的更多,积累的数据也会更多;我们则以线下的比赛,朋友间的社交为主。基于这种现状,我们和外国牌手的区别还是很大的,本身打法就有很大的不同。 朱亚希:我问过朋友如何跟AI比赛,要不要去线上先训练一下。他告诉我,没有必要。他认为我们还是有很大机会打败AI的,而且和AI比赛的打法也和我们跟人打牌是不一样的。 主持人司文:对手是AI,看不到肢体语言等细节,会不会对发挥有影响? 王天健:首先,我不是一个人在战斗,我们一共有六个队友。再者在我们身后还有技术团队,帮我们分析数据,出谋划策。从这个意义上讲,虽然看不到对手,但我们有这个集体在,我觉得大于失。 主持人:听说德扑AI也会诈唬,亚希你怎么看? 朱亚希:我们知道这个德扑的AI和人类进行了两次对抗,第一次的时候这个AI并不太令人惊讶,它就是有一套比较合理的打牌策略(那次比赛人类取胜了)。但第二次的AI就明显不一样了,尤其到后面,有一定的手牌数据积累之后,它针对某个人的策略就会非常强。平时它可能是打自己的完美策略,但一旦发现你的某些漏洞,或者策略上的问题,马上就会改变打法。所以很不太好对付。 王天健和童舟 主持人司文:人机大战的消息公布之后,很多网友也比较关注,提了一些问题。这位问德扑是否存在以不变应万变的策略。 王天健:是这样,以不变应万变本身就是一种策略。德扑本身就是不完全信息的游戏,所以可能你要有个以不变应万变的策略,但这个策略还是要根据情况改变的。我的建议是,你要有个80%的基础策略,但有20%是根据情况调整的,用来迷惑和误导对手。 主持人司文:德扑界的名人郭东不久前在跟网友说:不建议专职打扑克,MTT很好玩儿但很难作为职业!税金、差旅费这些决定了普通玩家打比赛从金钱的角度就是一个-EV(收益)的事情,它的意义在于通过学习德州扑克提升自己的思维和判断能力,克服贪婪、恐惧、愤怒、侥幸这些人性中与生俱来的负面的东西,提升自我之后更好的去完成自己的工作开创自己的事业,从这个角度讲是正EV(收益)的。亚希,你怎么看这个问题,因为你目前正好还在从事职业牌手这项事业。 朱亚希:我觉得郭老师的意思应该是:不能专业地去打比赛。如果把比赛当成主要收入的话,一是线下的比赛还不足够多,二是差旅开支也不低,三是打牌会有上风期间,下风期,有些人打了几年的牌也拿不了一次冠军也是有的。从这种意义上讲,专业的打比赛确实是不可取的。但是要鼓励大家去打专业的比赛,感受一下。去美国、欧洲的比赛看看,比赛里有很多小鲜肉可以看,还有不少投资人,多认识一些人,增长经历,本身就是收获。 朱亚希:第二个说打德扑可以提升一些能力,克服一些弱点。我是觉得这说得稍微有些夸张,打好德扑可能首先就要具备一定的素质,就像成功的创业者,投资人天生就要有一些能力一样。比如你本身就敏锐一点,本身就善于做决定,本身就比别人冷静,这样你才能打好德扑。然后你在打牌的过程当中,才能享受做决定,享受打牌的过程。 主持人司文:好,感谢龙之队队员给我们带来的分享。4月6号到10号,请大家关注德州扑克人机大战。 人工智能,你准备好了吗?! 此次德州扑克人机大战表演赛由创新工场与海南生态软件园联合主办,敬请期待!(文玄)[详情]

视频

微博推荐

更多

新浪意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 通行证注册 | 产品答疑

Copyright © 1996-2017 SINA Corporation, All Rights Reserved

新浪公司 版权所有