基于python的游戏玩家行为数据分析与预测_python有付费数据如何做简单预测

最新推荐文章于 2024-07-19 08:45:00 发布

2401_83974370

最新推荐文章于 2024-07-19 08:45:00 发布

阅读量885

点赞数 29

分类专栏： 2024年程序员学习文章标签： python 游戏数据分析

本文链接：https://blog.csdn.net/2401_83974370/article/details/137398063

版权

2024年程序员学习专栏收录该内容

246 篇文章 2 订阅

订阅专栏

4.玩家游戏习惯分析

活跃用户平均PVP次数

HY_pvp_battle_coun = data3[data3.avg_online_minutes> 10].pvp_battle_count.mean()

活跃用护pvp总次数

HY_count_pvp = data3[data3.avg_online_minutes> 10].pvp_battle_count.sum()

活跃用护pvp发起次数

HY_count_lanch_pvp = data3[data3.avg_online_minutes> 10].pvp_lanch_count.sum()

活跃用户主动发起PVP概率

HY_rate_lanch_pvp = HY_count_lanch_pvp/HY_count_pvp

活跃用户PVP胜利总次数

HY_num_win_pvp = data3[data3.avg_online_minutes> 10].pvp_win_count.sum()

活跃用户PVP胜利概率

HY_rate_win_pvp = HY_num_win_pvp/HY_count_pvp

print(f’活跃用户平均PVP次数:{HY_pvp_battle_coun}’)
print(f’活跃用户主动发起PVP概率:{HY_rate_lanch_pvp}’)
print(f’活跃用户PVP胜利概率:{HY_rate_win_pvp}’)

在这里插入图片描述

(2)

活跃用户平均PVE次数

HY_pve_battle_coun = data3[data3.avg_online_minutes> 10].pve_battle_count.mean()

活跃用护PVE总次数

HY_count_pve = data3[data3.avg_online_minutes> 10].pve_battle_count.sum()

活跃用护PVE发起次数

HY_count_lanch_pve = data3[data3.avg_online_minutes> 10].pve_lanch_count.sum()

活跃用户主动发起PVE概率

HY_rate_lanch_pve = HY_count_lanch_pve/HY_count_pve

活跃用户PVE胜利总次数

HY_num_win_pve = data3[data3.avg_online_minutes>=15].pve_win_count.sum()

活跃用户PVE胜利概率

HY_rate_win_pve = HY_num_win_pve/HY_count_pve

print(f’活跃用户平均PVE次数:{HY_pve_battle_coun}’)
print(f’活跃用户主动发起PVE概率:{HY_rate_lanch_pve}’)
print(f’活跃用户PVE胜利概率:{HY_rate_win_pve}’)
在这里插入图片描述

(3)

活跃付费用户平均PVP次数

HY_PAY_COUNT_pvp_battle_coun = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_battle_count.mean()

活跃付费用护pvp总次数

HY_PAY_COUNT_count_pvp = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_battle_count.sum()

活跃付费用护pvp发起次数

HY_PAY_COUNT_count_lanch_pvp = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_lanch_count.sum()

活跃付费用户主动发起PVP概率

HY_PAY_COUNT_rate_lanc_pvp = HY_PAY_COUNT_count_lanch_pvp/HY_PAY_COUNT_count_pvp

活跃付费用户PVP胜利总次数

HY_PAY_COUNT_num_win_pvp = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_win_count.sum()

活跃付费用户PVP胜利概率

HY_PAY_COUNT_rate_win_pvp = HY_PAY_COUNT_num_win_pvp/HY_PAY_COUNT_count_pvp

print(f’活跃付费用户平均PVP次数:{HY_PAY_COUNT_pvp_battle_coun}’)
print(f’活跃付费用户主动发起PVP概率:{HY_PAY_COUNT_rate_lanc_pvp}’)
print(f’活跃付费用户PVP胜利概率:{HY_PAY_COUNT_rate_win_pvp}’)

在这里插入图片描述

(4)

活跃付费用户平均PVe次数

HY_PAY_COUNT_pve_battle_coun = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_battle_count.mean()

付费用护pve总次数

HY_PAY_COUNT_count_pve = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_battle_count.sum()

付费用护pvp发起次数

HY_PAY_COUNT_count_lanch_pve = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_lanch_count.sum()

付费用户主动发起PVe概率

HY_PAY_COUNT_rate_lanc_pve = HY_PAY_COUNT_count_lanch_pve/HY_PAY_COUNT_count_pve

付费用户PVe胜利总次数

HY_PAY_COUNT_num_win_pve = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_win_count.sum()

付费用户PVe胜利概率

HY_PAY_COUNT_rate_win_pve = HY_PAY_COUNT_num_win_pve/HY_PAY_COUNT_count_pve

print(f’付费用户平均PVE次数:{HY_PAY_COUNT_pve_battle_coun}’)
print(f’付费用户主动发起PVE概率:{HY_PAY_COUNT_rate_lanc_pve}’)
print(f’付费用户PVE胜利概率:{HY_PAY_COUNT_rate_win_pve}’)
在这里插入图片描述

可视化
在这里插入图片描述

简评

1）活跃付费玩家的平均PVE次数和PVP次数都高于活跃玩家的，活跃付费玩家更愿意花时间在这个游戏上；
2）在PVP对战中，活跃付费玩家的获胜还率远超于活跃玩家，说明我们的游戏道具可以让APA享受到对战的获胜的乐趣；

三、分类模型的构建与评估的源代码、注释说明及运行结果

1.先构建特征热力矩阵图，了解各特征之间关系。

本部分需要完成回归模型和分类模型以及比较，故了解各特征关系尤为重要。在此之前创建一个新特征feature，将在线时间不满全体玩家平均在线时间一半的玩家定义为feature。并导入data3作为最后位一个特征。

在这里插入图片描述

2.模型的构建数据集划分

选用上部分创建的新特征进行分析。

此部分划分数据标签，训练集测试集，并且标准化数据集，将数据集设置为算法可以直接调用的状态。
顺带绘制混淆矩阵。

划分数据标签

data3_data = data3.iloc[:, :-1]
data3_target = data3.iloc[:, -1]
#划分训练集和测试集
from sklearn.model_selection import train_test_split
data3_data_train, data3_data_test, data3_target_train, data3_target_test = train_test_split(data3_data, data3_target, test_size=0.2, random_state=66)

标准化数据集

from sklearn.preprocessing import StandardScaler
stdScale = StandardScaler().fit(data3_data_train)
data3_trainScaler = stdScale.transform(data3_data_train)
data3_testScaler = stdScale.transform(data3_data_test)

#混淆矩阵
from sklearn.metrics import confusion_matrix
def test_pre(pred):
hx = confusion_matrix(data3_target_test, pred)
print(‘混淆矩阵:\n’,hx)

#精确率
P = hx[1,1]/ (hx[0, 1] + hx[1,1])
print(‘精确率:\n’,round(P, 3))

#召回率
R = hx[1,1]/ (hx[1, 0] + hx[1,1])
print(‘召回率:\n’,round(P, 3))

#F1值
F1 = 2 * P * R /(P+R)
print(‘F1值：’,round(F1, 3))

进行欠采样
在这里插入图片描述

2. SVM算法构建分类模型,并评价，ROC

利用SVM算法对数据集预测，并显示前20个预测结果。预测得出正确结果2125，错误结果69准确率为96%

在这里插入图片描述

评价部分
F1值为0.98和0.94
在这里插入图片描述

绘制ROC曲线
在这里插入图片描述

3.使用高斯朴素贝叶构建并评价

与SVM做法一致，差别只有算法不一样

在这里插入图片描述

评价模型，
相比起SVM，该模型准确率稍低，为75%,而根据分类报告结果显示准确率为0.98和0.54，f1值为0.80和0.70相较svm模型来说有较大差距。各项数据都低了一部分。
在这里插入图片描述

绘制ROC曲线

在这里插入图片描述

四、回归模型的构建与评估的源代码、注释说明及运行结果

1.划分数据集

本次实验特征为“充值次数”
此部分划分数据标签，训练集测试集，并且标准化数据集，将数据集设置为算法可以直接调用的状态。
在这里插入图片描述

2.实验随机森林回归模型进行构建

使用回归森林树算法
在这里插入图片描述

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Python开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024c （备注Python）

最后

Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

👉Python所有方向的学习路线👈

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

👉Python必备开发工具👈

工欲善其事必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。

👉Python全套学习视频👈

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

👉实战案例👈

学python就与学数学一样，是不能只看书不做题的，直接看步骤和答案会让人误以为自己全都掌握了，但是碰到生题的时候还是会一筹莫展。

因此在学习python的过程中一定要记得多动手写代码，教程只需要看一两遍即可。

👉大厂面试真题👈

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

一个人可以走的很快，但一群人才能走的更远。如果你从事以下工作或对以下感兴趣，欢迎戳这里加入程序员的圈子，让我们一起学习成长！

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

dnimg.cn/img_convert/99461e47e58e503d2bc1dc6f4668534a.png)

一个人可以走的很快，但一群人才能走的更远。如果你从事以下工作或对以下感兴趣，欢迎戳这里加入程序员的圈子，让我们一起学习成长！