建议大家去搜一下网球比赛规则、记分规则看看
• Develop a model that captures the flow of play as points occur and apply it to one or more of the matches. Your model should identify which player is performing better at a given time in the match, as well as how much better they are performing. Provide a visualization based on your model to depict the match flow. Note: in tennis, the player serving has a much higher probability of winning the point/game. You may wish to factor this into your model in some way.
•开发一个模型,捕捉得分时的比赛流程,并将其应用于一场或多场比赛。你的模型应该确定哪名球员在比赛的特定时间表现得更好,以及他们的表现有多好。根据您的模型提供可视化,以描述匹配流程。注:在网球比赛中,发球者赢得分数/局数的概率要高得多。您可能希望以某种方式将此因素纳入您的模型中。
训练模型来预测球员在比赛的特定时间表现得更好,以及他们的表现有多好;球员表现是否好依赖能否得分,一场下来要么play1得分、要么play2得分,所以可以落到二分类问题上(每一局是否得分),同时模型要求能够预测球员每个时点的表现,那么在变量列表中就应该包含时间特征/场次特征(如第三盘、第一小局),另外球员的个人水平和状态具有惯性、所以也需要统计之前场次的表现/得分特征(如第三盘开始时,球员1已经胜利的局数),题目提供的数据中还包括发球速度、发球方向、发球深度、返回深度等特征,以及是否发球者的0/1特征。综上,可以使用各种模型来预测球员在某一局的得分概率(可以认为概率越大、表现越好),模型可以选择多元逻辑回归(解释性强)、决策树、RF、xgboost等等,不建议用时间序列的深度学习、因为后续要求一定的解释能力
• A tennis coach is skeptical that “momentum” plays any role in the match. Instead, he postulates that swings in play and runs of success by one player are random. Use your model/metric to assess this claim.
•一位网球教练对“动力”在比赛中的作用持怀疑态度。相反,他假设比赛中的波动和一名球员的成功是随机的。使用您的模型/指标来评估此索赔。
。。。。。。
欢迎关注威信公众号 Python风控模型与数据分析,回复 24年美赛C题思路 获取完整思路