在足球的数据统计领域,还有很大的挖掘空间。我们经常说数据不能体现一切,了解一支球队或一名球员最重要的还是多看球。
对于足球来说,数据是一种辅助,帮助人们对赛况有一个轮廓性的了解,常用的数据基本上就是比分、控球率、射门、传球次数、传球成功率、犯规数、角球……评价个人时则会参考进球、助攻、传球、突破、抢断、解围、扑救、红黄牌、跑动距离、活动热图等数据。
这些数据其实比较片面,不能完全体现球队或球员的价值。所以数据也在进行着不断地进化和延伸,力求能从更多角度为看球的人提供参考。比如近些年已经开始被当作一项重要数据的“预期进球”,它可以更有效地体现球队及球员创造和把握机会的能力。
然而现阶段的数据类别,还是更倾向于进攻球员,中后场球员的作用并不能以一个特别直观的标准展现出来。为了在各个位置上追求平等,有机构发明了一个新的数据模型。
前段时间,有欧洲媒体报道称,根据这个新模型得出的结果,梅西的动作效率得分为1.21,与其他球员相比可以说是鹤立鸡群。而C罗只有0.61。
这是KU Leuven大学的某团队提出的新概念,用以把球员每个动作对比赛产生的影响具象化,这个概念被称为VAEP(Valuing Actions by Estimating Probabilities)。
据该团队统计,每场足球比赛至少会有1600个动作,每个动作都会对比赛产生影响,然而在传统的数据统计中,只有1%的动作会被体现出来。
比如曼城的这粒进球,拉波尔特的直传球其实对进球起了非常重要的影响,但从赛后的数据统计上来看,助攻的是萨内,进球的是热苏斯,拉波尔特的个人数据上,这不过是一脚成功传球/成功直塞球,根本看不出对进球的作用。
再比如,某位球员从中场左侧一脚长传将球转移至对方防守的弱侧,如果你看了球,会了解到这名球员对比赛的梳理,但从数据上看,这就是一脚成功的长传。
足球比赛中,球员的动作无非有两个目的:帮助本方进球,防止本方丢球。每一名球员的动作都会对这两个目的产生正向或反向的影响。
该团队根据一定的模型,给进球/丢球的机会估值,让比赛的即时状态具象化,这样一来,就能体现每一名球员每一个动作对比赛的影响。
也就是说,在该动作前的比赛状态为Si-1,进球机会的值为Pscores(Si-1),丢球机会值为Pconcedes(Si-1),经过了动作ai,比赛状态变为Si,进球机会的值变为Pscores(Si),丢球机会值为Pconcedes(Si)。那么一个动作对比赛结果产生的影响VAEP(ai)的公式为:
具体分析曼城上面那粒进球,拉波尔特那脚直塞球的VAEP值为+0.04,萨内的横传+0.36,热苏斯的射门+0.58,这样一来就能相对公平地体现出球员动作的价值。
当帕特里西奥扑出曼城的射门,那他的VAEP值也会增加,相对的,射失机会的球员VAEP值会减少。
每一场比赛,每一名球员都会得出一个总的VAEP值(经过出场时间换算),可以直观看出一名球员在本场比赛中的表现。
再看一个例子,2017-18赛季巴萨3-0皇马,巴萨的第三粒进球:布斯克茨将球交给边路的梅西,该动作对进球机会的增值为0;梅西回传,让球远离了禁区,增值为-0.01;布斯克茨又将球向前传给禁区边上的梅西,增值为0.01;梅西一对一过掉马塞洛,增值0.05;梅西禁区内传中,增值0.09;A-比达尔射门得分,增值0.83。如果比达尔最终没能将球打进,那此次射门动作他的增值为-0.17。
这项数据有一定的参考价值,以2017-18赛季英超为例,如果单按照每90分钟进球助攻数据进行统计,那像博格巴、孙兴慜、马赫雷斯、德布劳内、阿扎尔这样的顶尖球员根本排不进前10,而根据VAEP,这些球员的价值就被体现了出来。
提出这项研究的团队认为,VAEP给了球员一个更加公正的标准,对于各大俱乐部来说,在发掘年轻球员及寻找类型球员方便也有着积极作用。
下表是17-18赛季荷兰、比利时及法国联赛97后球员的VAEP数值,结果显示内雷斯、芒特、马尔科姆、姆巴佩和德容是该年龄段的佼佼者。从日后他们的发展来看,也基本符合预期。
下表体现的则是2017-18赛季五大联赛所有出场时间达到900分钟的球员,其动作的效率,横轴代表平均每一个动作的价值,纵轴代表平均每90分钟做动作数。按照这一计算方法,梅西对比赛的影响无人出其右。
当然,这项数据依然也存在很大的局限性,比如多数无球队员的行动还是无法体现出来,但还是给足球数据分析提供了一个新的参考。说到底,如果想领略一名球员或一支球队的能力,还是需要通过比赛画面,用自己的眼睛来判断,看球永远强过看数据。
(简浅)