实习期间,每个工作日的中午我都会抽1个小时的时间跟同事们踢毽子。踢得多了,对每天接到毽子的概率有了点感性上的认识,例如,有的时候10个回合以内(某个人踢一脚叫做一个回合)肯定能接到球,有的时候,50个回合以内都接不到球。我觉得,多少回合接到球这个问题,其实有很多因素影响着,我想尝试对这个问题进行建模,能够模拟出对于以下因素影响下的接球概率:
1.踢毽子总人数
- 人数太多,而场地有限,每个人能够接球的范围就会小
2.过度活跃分子人数
- 活跃分子会跨场抢球
3.某些人传球的倾向性
- 公司的老同事之间感情会特别好,传球会有偏向性
- 发现这样的组合并记录下来
4.站位——是不是站活跃分子隔壁,与活跃分子的距离
- 离活跃分子特别近很可能会被截球
5.风速
- 风速过大会使球更倾向于向某个方向飞行
- 北京天气app
6.技术不好的人数
- 因为技术不好,所以传到他的位置的时候总会落地,而重新发球之后往往传到他的正对面
7.技术特别好的人数(技术特别好就不会独食)
- 因为技术好,而有空观察场上的所有人,而能够观察到哪些人少踢,在自己拿到球的时候会向少踢的人传球
8.同project同事的数量
- 这个不用解释了
基本就是这么几个因素,另外还有很多因素会影响到你接到球的概率,包括:你当天的心情(心情不好别人也会少传球给你),抢球的欲望等等,但是除了上面的那些因素之外,心情和欲望这类型的变量难以量化,所以,只取上面的几个变量。
怎么定量呢?
- 接下来的整个假期我会尝试记录尽量多场球的以上变量,这个是X变量(8元组)。另外,记录每次拿到球的间隔回合数,这个是Y变量,在每天踢完球之后可以算出间隔数的平均值。
对于X变量:每个X变量都采取控制变量法去观察是没可能的,而且我的目标也不是计算某个因素的确切影响,我关心的不过是X->Y的关系。X这个8元组还好收集,因为几乎通过观察(站位)和回忆(其余7个)就能得到,而《某些人传球的倾向性》这个组合是可以通过经验积累得到的。
对于Y变量:平均的间隔数用1个小时内总的回合数除以自己踢到球的次数。而总的回合数是很难确切计算的,只能给出感觉上的认识,例如如果感觉每次毽子下地前都能轮流10个回合,然后乘以一个小时内毽子的落地数量(这个还是可以算1,2天取平均数的,虽然也是很麻烦),例如100次落地,那么就是总共1200回合。而我自己的接球的次数也是可以通过计算1,2天的平均次数而得到的。
得到X元组和Y变量之后,我想到了采用机器学习的方法,把所有数据扔给SVM,之后的东西就让它帮忙算吧,哈哈!怎么处理这些数据,或许之后会有其他办法也不一定吧。
好吧,start counting~