上接:2020美赛F奖论文(一):摘要、绪论和模型准备
全文:
3 传球网络模型(PNM)的建立和影响因子分析
为了构造结构化的传球网络,用来分析球员间传球配合的默契程度,应在不同多维度、状态变化情况下进行分析。例如从微观上两两球员之间的行为,到宏观上多个球员之间的行为;以及时间尺度从比赛中的单位时刻到整个赛季。
3.1 传球评价指标(PEI)
两人传球评价指数 PassValue ( p i , p j ) \text{PassValue}(p_{i}, p_{j}) PassValue(pi,pj),用于评价两人配合程度。在一场球赛中,宏观来看,球员相对于球场可以视为一个个节点,球场可以视为一个网络,每一次传球可以视为节点之间的连线。以两人之间每次传球累计评价 P assValue ( p i , p j ) P\text{assValue}\left( p_{i},\ p_{j} \right) PassValue(pi, pj)作为2人的传球评价指数。在多人传球评价体系中,将三个节点连接成闭合环路,边权之和即为3人传球评价指数。
PassValue ( p i , p j , p k ) = EdgeValue ( i , j ) + EdgeValue ( i , k ) + E dgeValue ( j , k ) \text{Pass}\text{Value}\left( p_{i},p_{j},p_{k} \right) = \ \text{EdgeValue}\left( i,j \right) + \text{EdgeValue}\left( i,k \right) + E\text{dgeValue}\left( j,k \right) PassValue(pi,pj,pk)= EdgeValue(i,j)+EdgeValue(i,k)+EdgeValue(j,k)
通过生活经验和数据挖掘所发现的规律可以构建PEI计算模型:
- Weight table of pass types:
α i is constant for i in Pass Types . \alpha_{i}\ \text{is}\ \text{constant}\ \text{for}\ i\ \text{in}\ \text{Pass}\ \text{Types}. αi is constant for i in Pass Types.
- 计算传球或接球时分别受到的防守压力 DefPress ( p i ) \text{Def}\text{Press}\left( p_{i} \right) DefPress(pi)
DefPress ( p i ) = 1 − 1 2 tan [ 11 6 × ( x p i 100 − 0.6 ) ] \text{Def}\text{Press}\left( p_{i} \right) = 1 - \frac{1}{2}\tan{\lbrack\frac{11}{6} \times (\frac{x_{p_{i}}}{100} - 0.6)\rbrack} DefPress(pi)=1−21tan[611×(100xpi−0.6)]
其中,x为球员到对方球门的横坐标,与受到的防守压力成负相关
- 两人之间的边权 EdgeValue ( i , j ) \text{EdgeValue}\left( i,j \right) EdgeValue(i,j),即单次传球评价,为此次传球类型的权重乘以防守压力加权平均数,量化为以下公式。
{ EdgeValue ( i , j ) = P assValue ( p i , p j ) P assValue ( p i , p j ) = ∑ i in Pass α i ∗ ( DefPress ( p i − from ) ∗ 0.3 + DefPress ( p i − to ) ∗ 0.7 ) \left\{ \begin{matrix} \text{EdgeValue}\left( i,j \right) = P\text{assValue}\left( p_{i},\ p_{j} \right) \\ P\text{assValue}\left( p_{i},\ p_{j} \right) = \sum_{i\ \text{in}\ \text{Pass}}^{}{\alpha_{i}*\left( \text{Def}\text{Press}\left( p_{i - \text{from}} \right)*0.3 + \text{Def}\text{Press}\left( p_{i - \text{to}} \right)*0.7 \right)} \\ \end{matrix} \right.\ {EdgeValue(i,j)=PassValue(pi, pj)PassValue(pi, pj)=∑i in Passαi∗(DefPress(pi−from)∗0.3+DefPress(pi−to)∗0.7)
根据这一传球评价指数模型,统计出一定时间范围内所有参与比赛的 N N N个球员的邻接矩阵数据 Arr \text{Arr} Arr。由 Arr [ i , j ] = P assValue ( p i , p j ) \text{Arr}\left\lbrack i,\ j \right\rbrack = P\text{assValue}\left( p_{i},\ p_{j} \right) Arr[i, j]=PassValue(pi, pj)得每两人之间所有传球价值评价总和图:
3.2 传球网络模型构建及识别网络模式
网络上两两球员之间的联系,宏观上体现为球员间传球的评价总和。筛选两人传球评价超过一定阈值的边,运用图论的方法选择性剔除交叉边,将基于传球评价指数构建的line-up传球网络可视化,用线的深浅表示 P assValue ( p i , p j ) P\text{assValue}\left( p_{i},\ p_{j} \right) PassValue(pi, pj):
{ lig h ter , P assValue ( p i , p j ) is less deeper , P assValue ( p i , p j ) is more \left\{ \begin{matrix} \text{lig}h\text{ter},P\text{assValue}\left( p_{i},\ p_{j} \right)\ \text{is}\ \text{less} \\ \text{deeper},P\text{assValue}\left( p_{i},\ p_{j} \right)\text{is}\ \text{more} \\ \end{matrix} \right.\ {lighter,PassValue(pi, pj) is lessdeeper,PassValue(pi, pj)is more
Color Pass ( i , j ) = Palette ( P assValue ( p i , p j ) − P assValue ( p a , p b ) P assValue ( p a , p b ) − P assValue ( p a , p b ) ) \text{Color}_{\text{Pass}}\left( i,j \right) = \text{Palette}\left( \frac{P\text{assValue}\left( p_{i},\ p_{j} \right) - \operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)}}{\operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)} - \operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)}} \right) ColorPass(i,j)=Palette(PassValue(pa, pb)−PassValue(pa, pb)PassValue(pi, pj)−PassValue(pa, pb))
从这一模型的可视化中,我们可以直观地分析传球配合频繁和默契地球员,还可以直观的看出主力球员中多人传球配合的组合。
N | Players | Score | |||
---|---|---|---|---|---|
2 | M1 | F2 | 342.4 | ||
M1 | M3 | 338.6 | |||
D5 | F2 | 213.4 | |||
3 | M1 | M3 | F2 | 816.1 | |
D5 | M1 | F2 | 727.8 | ||
4 | D5 | M1 | M3 | F2 | 1113.5 |
3.3 时间尺度上传球状态波动
传球频率会在时间尺度上进行波动。定义 Passe s ( 0 , t ) \text{Passe}s\left( 0,t \right) Passes(0,t)
Passes ( 0 , t ) is t h e sum of passes before t . \text{Passes}\left( 0,t \right)\ \text{is}\ the\ \text{sum}\ \text{of}\ \text{passes}\ \text{before}\ t. Passes(0,t) is the sum of passes before t.
并以
Passe
s
(
0
,
t
)
\text{Passe}s\left( 0,t \right)
Passes(0,t)作为球队实时状态的指标。球赛刚开始时,球员身体还未warm
up,导致传球概率密度较小,5—10分钟过后,传球效率逐渐提高并大致趋于稳定,即:
{
Passe
s
′
(
0
,
t
)
>
0
Passe
s
′
′
(
0
,
t
)
<
0
Passes
(
0
,
t
)
=
P
0
t
0
<
Halftime
2
\left\{ \begin{matrix} \text{Passe}s^{'}\left( 0,t \right) > 0 \\ \text{Passe}s^{''}\left( 0,t \right) < 0 \\ \operatorname{}\text{Passes}\left( 0,t \right) = P_{0} \\ t_{0} < \frac{\text{Halftime}}{2} \\ \end{matrix} \right.\
⎩⎪⎪⎨⎪⎪⎧Passes′(0,t)>0Passes′′(0,t)<0Passes(0,t)=P0t0<2Halftime
随着时间推移,球员们体力消耗,传球密度降低,即传球数量的增速减缓(虽然一场球赛中成功传球次数仍在增加,但传球失败频率开始增加),此后传球密度呈现下降趋势,即:
{ Passe s ′ ( 0 , t ) < 0 Passe s ′ ′ ( 0 , t ) > 0 Passes ( 0 , t ) = P 1 < P 0 t 0 > Halftime 2 \left\{ \begin{matrix} \text{Passe}s^{'}\left( 0,t \right) < 0 \\ \text{Passe}s^{''}\left( 0,t \right) > 0 \\ \operatorname{}\text{Passes}\left( 0,t \right) = P_{1} < P_{0} \\ t_{0} > \frac{\text{Halftime}}{2} \\ \end{matrix} \right.\ ⎩⎪⎪⎨⎪⎪⎧Passes′(0,t)<0Passes′′(0,t)>0Passes(0,t)=P1<P0t0>2Halftime
纵观整个赛季中38场球赛球员们的传球频率密度,整体上看可以与单场球赛所展示出的频率密度变化趋势相同。以时间为横坐标,成功传球密度为纵坐标作图:
Passes ( t 1 , t 2 ) = ∫ t 2 t 1 PassDiv ( t ) dt \text{Passes}\left( t_{1},t_{2} \right) = \int_{t_{2}}^{t_{1}}{\text{PassDiv}\left( t \right)\text{dt}} Passes(t1,t2)=∫t2t1PassDiv(t)dt
总体来说,传球的密度在时间尺度上相对稳定。若使用Monte Carlo方法对每次传球进行模拟,设定在上一次传球后下一次传球还需要的时间概率分布服从 N ( θ , 1 ) N\left( \theta,1 \right) N(θ,1),其中 θ \theta θ为统计的平均传球间隔时间,则在样本规模 N N N满足 N ≈ 2 \operatorname{}N \approx 2 N≈2时会近似与左图的分布;随着样本规模增加,当满足 N > 4 \operatorname{}N > 4 N>4后则会近似与右图的分布。因此我们可以认为每一个时间点发生传球事件的概率服从 N ( 0 , 1 ) N\left( 0,1 \right) N(0,1)。