新浪体育讯 数据密码
得分、篮板、助攻、抢断、封盖、失误……直观的数据单已经越来越难于反应球员真正的贡献和价值,在美国体育界,越来越繁复的数据运算体系被提出。而事实证明,数据分析绝不是偏执狂的数字游戏,它已经成为许多NBA球队认清自我、分析敌情和寻找价廉物美球员的利器。
文/袁汉
大凡我这个年纪的爱体育者,对纪录都是有点敏感的,这要感谢宋世雄韩乔生孙正平诸老师数十年如一日的语音洗脑,给我们灌输了破纪录是天大的事这样一种印象。美国人对纪录要么是过于尊重,要么就是过于随便,像NBA的纪录就花样繁多,如果把什么历史纪录、赛季纪录、球队纪录、个人纪录都算上,场场比赛都有纪录可破。
纪录多了也就不那么珍贵,只有少数让人怎么也无法忘却的纪录才显得货真价实,在我而言那意味着威尔特-张伯伦的百分比赛,奥斯卡-罗伯逊的三双赛季,科比-布莱恩特对猛龙兰博式的屠杀,还有菲尼克斯希尔顿酒店大堂里穆雷尚对我的俯视(我想当时他可能需要一个放大镜)。
本赛季打到一半,我印象最深的纪录当属森林狼大前锋勒夫的“双31之夜”,毕竟上一次NBA出现单场个人得分和篮板球同时上30的异象时,我家还没有电视机呢,所以这次算是开了眼。话说勒夫本赛季的生猛不是抽疯式的生猛,30多分或20几个篮板球的表现那是隔三岔五就有一次,有人说这赛季的最快进步球员奖直接先颁给他得了,对此我……有些意见。
关公战秦琼
在遇到勒夫是不是本赛季最快进步球员这个问题之前,其实我一直在苦苦思考一个更宏大、更高深、更有历史责任感的问题:关公和秦琼究竟哪一个更猛?我也可以自豪地宣布,我已经破解了这个千古之谜,具体的方法是让杨六郎跟这二位抡开了各打一场,如果关公赢了、秦琼输了,那么谁更猛自然不言而喻;万一杨六郎全赢或全输也没关系,咱还可以换岳飞、薛仁贵、七侠五义、东邪西毒什么的接着上。
哥没有看过穿越小说,但这并不妨碍哥用穿越的辩证法则看问题。关公战秦琼与NBA有着辩证的联系,无论你想争论张伯伦和迈克尔-乔丹哪一个更猛,奥尔巴赫的凯尔特人和菲尔-杰克逊的公牛哪一个更强,本赛季的勒夫和上赛季的他哪一个更棒,除了把他们放到一个公平的擂台上就别无他法。至于这个作为穿越媒介的擂台如何搭建,且用球队之间的比较做个例子。
我们知道,同一个赛季的球队谁强谁弱是不难比较的,他们处在同一时空中,有着相同的环境。想要公正比较不同年代的球队则是不可能的,杰克逊可以列举各种数据说我的公牛比奥尔巴赫的凯尔特人强多了,“红衣主教”只需一句话就能把他驳得哑口无言:“小老弟,你们穿的鞋可是塞了气垫的,我们的鞋还是帆布面橡胶底的呢。”
仅仅一双鞋就能造成不可比性,如果把比赛用球、场馆设施、训练手段的新旧差距都考虑进去,问题还会复杂上无数倍。大多数不确定因素对比赛最重要的影响是节奏和速度,我们常常听说“德安东尼崇尚快节奏篮球”“活塞是一支慢节奏球队”之类的评价,却不知道这些评价并不是凭印象得来,而是有实实在在的硬指标。
判断球队比赛节奏快慢的指标被称为“速度指标”,这个指标是通过统计一支球队每场比赛的控球次数得来。本赛季的勇士场均控球次数是全联盟最高的100.4次,开拓者的87.7次则在全联盟垫底,因此我们可以说勇士是本赛季最快的球队,开拓者则是最慢的球队。鉴于每场比赛的双方都是交替攻防,单场控球次数基本相同,我们甚至可以计算出勇士平均完成一次进攻耗时14.3秒,开拓者则需要16.4秒。
速度指标为不同历史时期的球队乃至球员的比较搭起了一座基本公正的擂台,通过这项数据演化出的各种新数据大大拓展了篮球数据研究的疆域。在今天的“数据派”所使用的主流工具中,速度指标是最基本的单位,这一理论的实践者包括前北卡罗来纳大学名帅迪安-史密斯、他的弟子弗兰克-麦圭尔和火箭总经理达里尔-莫雷等人。
曼利的命门
了解速度指标是球队对比的基本媒介这一概念后,我们暂且把它放到一边,接着谈球员的评判数据。传统的个人数据种类不能算少,其中得分、篮板球、助攻这三项与“两双”或“三双”有关的数据是相对比较受重视的,但它们往往难以反映球员的表现对比,就拿1月17日的两场比赛来说,科比拿了27分、9个篮板球和5次助攻,托尼-帕克有30分、7个篮板球和4次助攻,你倒说说看谁的表现更好?
长久以来,篮球数据分析专家们就在追寻一种“综合数据”,即通过对传统数据的某种演算得出一个数字,可以反映球员的综合表现。早几年较为流行的是“效率指数”,简单地说就是把得分、篮板球、助攻之类的正面数据相加,再减去失误、犯规、投篮不中之类的负面数据。ESPN体育网曾经采用过这一数据,目前NBA官方网站的赛后技术统计也有这一项。
最简单的方法是所有正面贡献加一,负面贡献减一,这一简单的统计公式最早由马丁-曼利在1989年出版的《篮球天堂》一书中公布,因此也被称为“曼利贡献指数”。ESPN体育网最早采用的就是这种计算方式,直到今天还有一些篮球数据和博彩网站在沿用。如果用曼利贡献指数来评估,本赛季数据爆得最厉害的球员应是山猫后卫奥古斯丁,勒夫与猛龙前锋雷吉-埃文斯并列第二。
奥古斯丁的曼利贡献指数比上赛季增长了10.2,主要来源于场均多出的8分和3.9次助攻,在克服了本赛季初的手感问题和自信缺失后,他充分利用了费尔顿远走纽约后为他留下的首发机会。埃文斯的情况也大同小异,上赛季只打了28场比赛的他本赛季场场首发,直至被脚伤击倒,他的主要数据增长点是场均多抓下8.4个篮板球,这为他的曼利贡献指数带来了9.3的增长。
与前两位相比,勒夫的数据增长更为全面,他场均多得7.2分和4.7个篮板球,三分球命中率的增幅也尤其显著,他的曼利贡献指数同样比上赛季增长了9.3。固然勒夫的绝对数据比奥古斯丁和埃文斯漂亮得多,但是既然谈论的是爆数据,那肯定要以增幅作为依据才来得公平,哪怕人人都觉得这么排法始终有点不对劲。
我也觉得不对劲,这是因为我知道曼利贡献指数绝对是一个有很大缺陷的体系,每项传统数据单纯加一或减一的算法就是它的致命伤。曼利无法合理解释凭什么得到一分和抓下一个篮板球对一场比赛就能产生等量的贡献,后场篮板球又凭什么与前场篮板球价值一样,最要命的是奥古斯丁和埃文斯本赛季的上场时间都增加了15分钟以上,勒夫只增加了8.4分钟,这种差别在他的评价体系中毫无体现。
巨星无井喷
我想ESPN放弃曼利贡献指数,主要原因就是他们认识到了其中的先天缺陷。取而代之的是一种名为“球员效率指数”的新数据,而且ESPN还一不做二不休地把它的发明者、《职业篮球赛季解析》丛书的作者约翰-霍林格收编为数据专栏作家。球员效率指数首先是一种以分钟为单位的个人表现指数,这就避开了上场时间增减带来的失真。
球员效率指数也是我所见过的此类指数中算法最为复杂、最接近客观公正标准的一种,霍林格在海量统计的基础上,为各项数据加上了加权指数,尽量还原它们在比赛中所起到的作用,还把全队的表现和全联盟的各项平均值也考虑在其中。也许球员效率指数还不是最完美的个人表现评估指数,但是在目前我所知道的十余种评估体系还没有哪一种能超越它。
我用球员效率指数计算出了本赛季所有球员的进步(或退步),需要说明的是统计前的筛选条件。首先,在上赛季和本赛季中只打了一个赛季的球员自然要排除,这其中包括了本赛季所有的新秀,因为他们没有参照标准。接着,我排除了近两个赛季场均上场时间不足12分钟的球员,这是因为取样太少就不够客观。
这样一番筛选后剩下的球员有275人,他们当中本赛季球员效率指数提升最高的有小牛后卫史蒂文森(10.8)、步行者老将福斯特(6.8)和快艇后卫埃里克-戈登(6.4),至于勒夫(3.5)则与勇士后卫斯蒂芬-柯里并列第25位。我承认这份排名同样别扭,但是与曼利贡献指数那份排名相比,它别扭得理直气壮。
排名前10位中显著的缺席者包括本赛季场均得分暴增9.5分的多雷尔-赖特,抢篮板球功力大涨的埃文斯,以及场均助攻多出3.6个的隆多。如果我们探讨的只是单项数据的突飞猛进,漏掉这些球员自然是不可饶恕的罪过,但是以偏概全地把这些“偏科生”列为进步最大的同学,未免对不住那些全面发展的好学生。
赖特离开热队后在勇士打上了首发,每场比赛的出手机会也比上赛季翻了一倍不止,对他这样一位攻击范围广的球员而言,机会的增加带来得分的爆发几乎是必然的,事实上他的投篮和罚球命中率比上赛季还下降了一些。埃文斯的偏科就更加厉害,他的上场时间增加了16.2分钟,得分只增加了0.6分,我们总不能说只因他抓的篮板球比上赛季的博什还多,猛龙就填补了四号位的窟窿。
至于隆多,他的进步也只是单纯地体现在助攻方面,得分还略有下降,由于他上赛季的球员效率指数也不低,全面的数据井喷对他而言很难。勒夫也是同样的情况,别忘了上赛季他就拿下了赛季总评“两双”,对阵太阳时也变过23分和22个篮板球的戏法。总的来说,巨星或准巨星们跟数据井喷就联系不到一块,科比和勒布朗-詹姆斯已经打到这地步,要是再来个井喷,只能去打火星联赛了。
一念判强弱
那么,像史蒂文森、福斯特和戈登这种德智体美劳全面发展的好学生,究竟有没有给他们的球队带来改头换面的帮助呢?这涉及到球队强弱的判定,我们又要回到一开始谈过的速度指标。速度指标当然无法显示球队的强弱,要是我说勇士比热队更强,那明天我就可以改行去卖烧饼了,不过用速度指标推算球队的强弱却是可行的。
我说过,速度指标为球队间的比较搭起了一座基本公正的擂台,具体的实现方式之一就是在百次控球这个共同的基础上计算球队的攻击力和防守力。一支球队每100次控球的平均得分称为“进攻效率”,这个值是越高越好;每100次控球的平均失分称为“防守效率”,这个值是越低越好。
以目前胜率最高的马刺为例,他们的进攻效率111.7,排在联盟第二位,防守效率103.2,排在联盟第七位,由此我们可以说波波维奇的球队攻防俱佳,又以略偏进攻为主,这是他们如此成功的原因所在。再加上一个简单的步骤,我们可以知道热队平均每100次控球可以净胜8.6分,排在全联盟第一位,而失去詹姆斯 的骑士变成了一支不折不扣的烂队,平均每100次控球净负12.1分。
我不知道ESPN的球队排名采用的是什么算法,不过我算出的百次控球净胜排名与他们最新的球队排名相参照,差别就在一两位,大概他们至少也参照了这种排名方式。据我所知,一些博彩公司开盘也会参照不断更新的百次控球净胜,比如热队和火箭的比赛可以开热队让8.5分左右,当然实际要考虑的因素会更多,比如球员的缺阵、主客场因素、赛程因素等等,我这里只是简单举个例子。
当球队的强弱有了一个较为客观的评判标准时,再结合更多的传统和创新数据,对它们的分析和比较就要方便得多。比如仅仅是粗略地看上一眼,我们就知道网队为何迫切地希望引进卡梅罗-安东尼来解决他们的进攻乏力问题,而掘金的实力要高于他们现在西部第七的排名,如果我是“甜瓜”,单纯从球队战斗力角度考虑,本赛季留在丹佛是更好的选择。
豪门靠底气
把本赛季球员效率指数增长排名前10位的球员和球队百次控球净胜排名对照起来看,可以发现NBA目前最强的五支球队中大都没有数据井喷的家伙,只有湖人的香农-布朗是个例外。考虑到卫冕冠军的胜利主要还是来自科比、保-加索尔、奥多姆和阿泰斯特这些核心球员,布朗的发威只是锦上添花,绝非雪中送炭。
与布朗并列第10的奇才后卫尼克-扬在阿雷纳斯离开后一跃成为队中头号得分手,饶是这样他和“状元秀”沃尔联手也没能拯救球队于水火之中,可见一两个球员的力量总归有限。像热队、马刺、凯尔特人、湖人和公牛这种真正强大的球队,都有配得上“三巨头”乃至“四巨头”称号的核心,这才是靠得住的底气。
本赛季进步最大的史蒂文森是个有趣的案例,上赛季被奇才交易到小牛的他受背伤所困,投篮命中率降到28.2%,球员效率指数也给拖累到只有3.3。一个“奔三”的老将,有严重的伤病问题,偏偏主要的进攻手段又是突破上篮,所以霍林格赛季初给史蒂文森批八字时也刻薄地说:“这伙计完了,他内突突不进,远投投不准,也就剩下垃圾话还说得流利了。”
谁承想史蒂文森运道好,小牛主帅卡莱尔也不信邪,眼看博布瓦的伤说不定什么时候能好,就硬着头皮把霍林格口中的“衰神”往首发阵容里塞。史蒂文森也挺争气,不光逮着机会还能突两下,而且匪夷所思地摇身变为全队准头最好的三分球专家。话说史蒂文森新秀赛季的三分球命中率是8.3%,接下来的一个赛季下滑到8%,今年居然投出45.7%的三分命中率,真是彪悍的人生不需要解释。
史蒂文森的爆发属于那种不显山露水型的,他的功力都涨在命中率上了,也就是我们常说的得分效率高,但他吃亏在只是个角色球员,场均7.1分的得分很难给人留下深刻印象。倒是年轻的快船后卫戈登如果能保持目前的势头,本赛季的最有进步球员多半就非他莫属了。今年快船最抢眼的球员是格里芬没错,但戈登还是队中的头号得分手,这对组合类似奇才的沃尔和扬组合,在一起磨练两年前途光明可期。
他有多给力?
有必要研究一下格里芬这个单独的个例,虽然他上赛季彻底报废,现在只是个新秀身份,数据爆发没有参照也就无从谈起。单纯地看,一个场均22.8分、12.9个篮板球外加3.5次助攻的新秀也够恐怖了,上一次有球员打出与格里芬类似的新秀赛季数据还要追溯到1993年,那家伙的名字是奥尼尔(场均23.4分、13.9个篮板球和1.9次助攻)。
在球员效率指数方面,格里芬已经把所有新秀远远甩在后面,而奇才的“状元秀”沃尔仅排在第四位,挤在他俩中间的是火箭的帕特森和步行者的乔治。沃尔只能怪自己人品欠佳,同样是跟上赛季伤停的“状元秀”抢戏,凭什么德里克-罗斯就遇上了奥登这么个软柿子,而他撞上的偏偏是很给力的格里芬。
格里芬的蹿红也印证了小众球队年轻球员成名的新模式,全世界不会有多少球迷能经常看到快船的比赛直播,但网上视频是越来越容易看到了。格里芬的暴扣集锦是视频分享网站上点击最多的热门画面之一,尤其是他骑扣俄罗斯人莫兹戈夫那一段,已经成为本赛季最经典的镜头。
格里芬与新秀赛季的奥尼尔相似,绝不仅仅体现在主要数据上,他们都是以新秀之身成为一支球队的攻防核心,他们的进攻效率都不是高得离谱,对篮板球,尤其是后场篮板球的控制能力都令人乍舌。更妙的是,格里芬也和奥尼尔一样,一站上罚球线就有点慌神,他俩的进攻效率在很大程度上是被罚球拉下来的。当然,奥尼尔的盖帽比格里芬强多了,后者则在控制犯规、减少失误方面做得更好。
最后想说的是,篮球数据分析在美国四大职业体育联盟中起步最晚,其生命力也是目前最旺盛的。除了本文中使用的理论体系外,正在挤入传统数据体系的尚有正负贡献值系统、阵容组合理论、个人赢球贡献比例等。数据分析绝不是偏执狂的数字游戏,它已经成为许多NBA球队认清自我、分析敌情和寻找价廉物美球员的利器。当中国的篮球数据分析也如此兴盛时,我们的篮球水平必然已达到了一个更高的层次。
(袁汉)