2020美赛F奖论文（二）：传球网络模型（PNM）的建立和影响因子分析

最新推荐文章于 2023-12-13 20:10:52 发布

頔潇

最新推荐文章于 2023-12-13 20:10:52 发布

阅读量5.1k

点赞数 11

分类专栏：数学建模机器学习文章标签：网络数据挖掘 python 人工智能图论

本文链接：https://blog.csdn.net/gzn00417/article/details/105813807

版权

数学建模同时被 2 个专栏收录

21 篇文章

订阅专栏

机器学习

18 篇文章

订阅专栏

上接：2020美赛F奖论文（一）：摘要、绪论和模型准备
全文：

2020美赛F奖论文（一）：摘要、绪论和模型准备
2020美赛F奖论文（二）：传球网络模型（PNM）的建立和影响因子分析
2020美赛F奖论文（三）：足球团队指标和基于机器学习的球队表现预测
2020美赛F奖论文（四）：模拟退火算法驱动的结构策略设计
2020美赛F奖论文（五）：结合团队动力学的模型拓展、模型评价

GitHub仓库

文章目录

3 传球网络模型（PNM）的建立和影响因子分析

3 传球网络模型（PNM）的建立和影响因子分析

为了构造结构化的传球网络，用来分析球员间传球配合的默契程度，应在不同多维度、状态变化情况下进行分析。例如从微观上两两球员之间的行为，到宏观上多个球员之间的行为；以及时间尺度从比赛中的单位时刻到整个赛季。

3.1 传球评价指标（PEI）

两人传球评价指数 $\text{PassValue}(p_{i}, p_{j})$ ，用于评价两人配合程度。在一场球赛中，宏观来看，球员相对于球场可以视为一个个节点，球场可以视为一个网络，每一次传球可以视为节点之间的连线。以两人之间每次传球累计评价 $P\text{assValue}\left( p_{i},\ p_{j} \right)$ 作为2人的传球评价指数。在多人传球评价体系中，将三个节点连接成闭合环路，边权之和即为3人传球评价指数。

$\text{Pass}\text{Value}\left( p_{i},p_{j},p_{k} \right) = \ \text{EdgeValue}\left( i,j \right) + \text{EdgeValue}\left( i,k \right) + E\text{dgeValue}\left( j,k \right)$

通过生活经验和数据挖掘所发现的规律可以构建PEI计算模型：

Weight table of pass types:

$\alpha_{i}\ \text{is}\ \text{constant}\ \text{for}\ i\ \text{in}\ \text{Pass}\ \text{Types}.$

Pass weights

计算传球或接球时分别受到的防守压力 $\text{Def}\text{Press}\left( p_{i} \right)$

$\text{Def}\text{Press}\left( p_{i} \right) = 1 - \frac{1}{2}\tan{\lbrack\frac{11}{6} \times (\frac{x_{p_{i}}}{100} - 0.6)\rbrack}$

其中，x为球员到对方球门的横坐标，与受到的防守压力成负相关

两人之间的边权 $\text{EdgeValue}\left( i,j \right)$ ，即单次传球评价，为此次传球类型的权重乘以防守压力加权平均数，量化为以下公式。

$\left\{ \begin{matrix} \text{EdgeValue}\left( i,j \right) = P\text{assValue}\left( p_{i},\ p_{j} \right) \\ P\text{assValue}\left( p_{i},\ p_{j} \right) = \sum_{i\ \text{in}\ \text{Pass}}^{}{\alpha_{i}*\left( \text{Def}\text{Press}\left( p_{i - \text{from}} \right)*0.3 + \text{Def}\text{Press}\left( p_{i - \text{to}} \right)*0.7 \right)} \\ \end{matrix} \right.\$

根据这一传球评价指数模型，统计出一定时间范围内所有参与比赛的 $N$ 个球员的邻接矩阵数据 $\text{Arr}$ 。由 $\text{Arr}\left\lbrack i,\ j \right\rbrack = P\text{assValue}\left( p_{i},\ p_{j} \right)$ 得每两人之间所有传球价值评价总和图:

整个赛季单次评价图

3.2 传球网络模型构建及识别网络模式

网络上两两球员之间的联系，宏观上体现为球员间传球的评价总和。筛选两人传球评价超过一定阈值的边，运用图论的方法选择性剔除交叉边，将基于传球评价指数构建的line-up传球网络可视化，用线的深浅表示 $P\text{assValue}\left( p_{i},\ p_{j} \right)$ ：

$\left\{ \begin{matrix} \text{lig}h\text{ter},P\text{assValue}\left( p_{i},\ p_{j} \right)\ \text{is}\ \text{less} \\ \text{deeper},P\text{assValue}\left( p_{i},\ p_{j} \right)\text{is}\ \text{more} \\ \end{matrix} \right.\$

$\text{Color}_{\text{Pass}}\left( i,j \right) = \text{Palette}\left( \frac{P\text{assValue}\left( p_{i},\ p_{j} \right) - \operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)}}{\operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)} - \operatorname{}{P\text{assValue}\left( p_{a},\ p_{b} \right)}} \right)$

单场比赛的两两传球网络图

从这一模型的可视化中，我们可以直观地分析传球配合频繁和默契地球员，还可以直观的看出主力球员中多人传球配合的组合。

N	Players	Score
2	M1	F2			342.4
	M1	M3			338.6
	D5	F2			213.4
3	M1	M3	F2		816.1
	D5	M1	F2		727.8
4	D5	M1	M3	F2	1113.5

3.3 时间尺度上传球状态波动

传球频率会在时间尺度上进行波动。定义 $\text{Passe}s\left( 0,t \right)$

$\text{Passes}\left( 0,t \right)\ \text{is}\ the\ \text{sum}\ \text{of}\ \text{passes}\ \text{before}\ t.$

并以 $\text{Passe}s\left( 0,t \right)$ 作为球队实时状态的指标。球赛刚开始时，球员身体还未warm
up，导致传球概率密度较小，5—10分钟过后，传球效率逐渐提高并大致趋于稳定，即：

$\left\{ \begin{matrix} \text{Passe}s^{'}\left( 0,t \right) > 0 \\ \text{Passe}s^{''}\left( 0,t \right) < 0 \\ \operatorname{}\text{Passes}\left( 0,t \right) = P_{0} \\ t_{0} < \frac{\text{Halftime}}{2} \\ \end{matrix} \right.\$
随着时间推移，球员们体力消耗，传球密度降低，即传球数量的增速减缓（虽然一场球赛中成功传球次数仍在增加，但传球失败频率开始增加），此后传球密度呈现下降趋势，即：

$\left\{ \begin{matrix} \text{Passe}s^{'}\left( 0,t \right) < 0 \\ \text{Passe}s^{''}\left( 0,t \right) > 0 \\ \operatorname{}\text{Passes}\left( 0,t \right) = P_{1} < P_{0} \\ t_{0} > \frac{\text{Halftime}}{2} \\ \end{matrix} \right.\$

纵观整个赛季中38场球赛球员们的传球频率密度，整体上看可以与单场球赛所展示出的频率密度变化趋势相同。以时间为横坐标，成功传球密度为纵坐标作图：

$\text{Passes}\left( t_{1},t_{2} \right) = \int_{t_{2}}^{t_{1}}{\text{PassDiv}\left( t \right)\text{dt}}$

第1场比赛传球密度
整个赛季传球密度

总体来说，传球的密度在时间尺度上相对稳定。若使用Monte Carlo方法对每次传球进行模拟，设定在上一次传球后下一次传球还需要的时间概率分布服从 $N\left( \theta,1 \right)$ ，其中 $\theta$ 为统计的平均传球间隔时间，则在样本规模 $N$ 满足 $\operatorname{}N \approx 2$ 时会近似与左图的分布；随着样本规模增加，当满足 $\operatorname{}N > 4$ 后则会近似与右图的分布。因此我们可以认为每一个时间点发生传球事件的概率服从 $N\left( 0,1 \right)$ 。

下接：2020美赛F奖论文（三）：足球团队指标和基于机器学习的球队表现预测
全文：

2020美赛F奖论文（一）：摘要、绪论和模型准备
2020美赛F奖论文（二）：传球网络模型（PNM）的建立和影响因子分析
2020美赛F奖论文（三）：足球团队指标和基于机器学习的球队表现预测
2020美赛F奖论文（四）：模拟退火算法驱动的结构策略设计
2020美赛F奖论文（五）：结合团队动力学的模型拓展、模型评价