4.玩家游戏习惯分析
活跃用户平均PVP次数
HY_pvp_battle_coun = data3[data3.avg_online_minutes> 10].pvp_battle_count.mean()
活跃用护pvp总次数
HY_count_pvp = data3[data3.avg_online_minutes> 10].pvp_battle_count.sum()
活跃用护pvp发起次数
HY_count_lanch_pvp = data3[data3.avg_online_minutes> 10].pvp_lanch_count.sum()
活跃用户主动发起PVP概率
HY_rate_lanch_pvp = HY_count_lanch_pvp/HY_count_pvp
活跃用户PVP胜利总次数
HY_num_win_pvp = data3[data3.avg_online_minutes> 10].pvp_win_count.sum()
活跃用户PVP胜利概率
HY_rate_win_pvp = HY_num_win_pvp/HY_count_pvp
print(f’活跃用户平均PVP次数:{HY_pvp_battle_coun}’)
print(f’活跃用户主动发起PVP概率:{HY_rate_lanch_pvp}’)
print(f’活跃用户PVP胜利概率:{HY_rate_win_pvp}’)
(2)
活跃用户平均PVE次数
HY_pve_battle_coun = data3[data3.avg_online_minutes> 10].pve_battle_count.mean()
活跃用护PVE总次数
HY_count_pve = data3[data3.avg_online_minutes> 10].pve_battle_count.sum()
活跃用护PVE发起次数
HY_count_lanch_pve = data3[data3.avg_online_minutes> 10].pve_lanch_count.sum()
活跃用户主动发起PVE概率
HY_rate_lanch_pve = HY_count_lanch_pve/HY_count_pve
活跃用户PVE胜利总次数
HY_num_win_pve = data3[data3.avg_online_minutes>=15].pve_win_count.sum()
活跃用户PVE胜利概率
HY_rate_win_pve = HY_num_win_pve/HY_count_pve
print(f’活跃用户平均PVE次数:{HY_pve_battle_coun}’)
print(f’活跃用户主动发起PVE概率:{HY_rate_lanch_pve}’)
print(f’活跃用户PVE胜利概率:{HY_rate_win_pve}’)
(3)
活跃付费用户平均PVP次数
HY_PAY_COUNT_pvp_battle_coun = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_battle_count.mean()
活跃付费用护pvp总次数
HY_PAY_COUNT_count_pvp = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_battle_count.sum()
活跃付费用护pvp发起次数
HY_PAY_COUNT_count_lanch_pvp = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_lanch_count.sum()
活跃付费用户主动发起PVP概率
HY_PAY_COUNT_rate_lanc_pvp = HY_PAY_COUNT_count_lanch_pvp/HY_PAY_COUNT_count_pvp
活跃付费用户PVP胜利总次数
HY_PAY_COUNT_num_win_pvp = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pvp_win_count.sum()
活跃付费用户PVP胜利概率
HY_PAY_COUNT_rate_win_pvp = HY_PAY_COUNT_num_win_pvp/HY_PAY_COUNT_count_pvp
print(f’活跃付费用户平均PVP次数:{HY_PAY_COUNT_pvp_battle_coun}’)
print(f’活跃付费用户主动发起PVP概率:{HY_PAY_COUNT_rate_lanc_pvp}’)
print(f’活跃付费用户PVP胜利概率:{HY_PAY_COUNT_rate_win_pvp}’)
(4)
活跃付费用户平均PVe次数
HY_PAY_COUNT_pve_battle_coun = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_battle_count.mean()
付费用护pve总次数
HY_PAY_COUNT_count_pve = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_battle_count.sum()
付费用护pvp发起次数
HY_PAY_COUNT_count_lanch_pve = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_lanch_count.sum()
付费用户主动发起PVe概率
HY_PAY_COUNT_rate_lanc_pve = HY_PAY_COUNT_count_lanch_pve/HY_PAY_COUNT_count_pve
付费用户PVe胜利总次数
HY_PAY_COUNT_num_win_pve = data3[(data3.avg_online_minutes>10) & (data3.pay_price>0)].pve_win_count.sum()
付费用户PVe胜利概率
HY_PAY_COUNT_rate_win_pve = HY_PAY_COUNT_num_win_pve/HY_PAY_COUNT_count_pve
print(f’付费用户平均PVE次数:{HY_PAY_COUNT_pve_battle_coun}’)
print(f’付费用户主动发起PVE概率:{HY_PAY_COUNT_rate_lanc_pve}’)
print(f’付费用户PVE胜利概率:{HY_PAY_COUNT_rate_win_pve}’)
可视化
简评
1)活跃付费玩家的平均PVE次数和PVP次数都高于活跃玩家的,活跃付费玩家更愿意花时间在这个游戏上;
2)在PVP对战中,活跃付费玩家的获胜还率远超于活跃玩家,说明我们的游戏道具可以让APA享受到对战的获胜的乐趣;
三、分类模型的构建与评估的源代码、注释说明及运行结果
1.先构建特征热力矩阵图,了解各特征之间关系。
本部分需要完成回归模型和分类模型以及比较,故了解各特征关系尤为重要。在此之前创建一个新特征feature,将在线时间不满全体玩家平均在线时间一半的玩家定义为feature。并导入data3作为最后位一个特征。
2.模型的构建数据集划分
选用上部分创建的新特征进行分析。
此部分划分数据标签,训练集测试集,并且标准化数据集,将数据集设置为算法可以直接调用的状态。
顺带绘制混淆矩阵。
划分数据标签
data3_data = data3.iloc[:, :-1]
data3_target = data3.iloc[:, -1]
#划分训练集和测试集
from sklearn.model_selection import train_test_split
data3_data_train, data3_data_test, data3_target_train, data3_target_test = train_test_split(data3_data, data3_target, test_size=0.2, random_state=66)
标准化数据集
from sklearn.preprocessing import StandardScaler
stdScale = StandardScaler().fit(data3_data_train)
data3_trainScaler = stdScale.transform(data3_data_train)
data3_testScaler = stdScale.transform(data3_data_test)
#混淆矩阵
from sklearn.metrics import confusion_matrix
def test_pre(pred):
hx = confusion_matrix(data3_target_test, pred)
print(‘混淆矩阵:\n’,hx)
#精确率
P = hx[1,1]/ (hx[0, 1] + hx[1,1])
print(‘精确率:\n’,round(P, 3))
#召回率
R = hx[1,1]/ (hx[1, 0] + hx[1,1])
print(‘召回率:\n’,round(P, 3))
#F1值
F1 = 2 * P * R /(P+R)
print(‘F1值:’,round(F1, 3))
进行欠采样
2. SVM算法构建分类模型,并评价,ROC
利用SVM算法对数据集预测,并显示前20个预测结果。预测得出正确结果2125,错误结果69准确率为96%
评价部分
F1值为0.98和0.94
绘制ROC曲线
3.使用高斯朴素贝叶构建并评价
与SVM做法一致,差别只有算法不一样
评价模型,
相比起SVM,该模型准确率稍低,为75%,而根据分类报告结果显示准确率为0.98和0.54,f1值为0.80和0.70相较svm模型来说有较大差距。各项数据都低了一部分。
绘制ROC曲线
四、回归模型的构建与评估的源代码、注释说明及运行结果
1.划分数据集
本次实验特征为“充值次数”
此部分划分数据标签,训练集测试集,并且标准化数据集,将数据集设置为算法可以直接调用的状态。
2.实验随机森林回归模型进行构建
使用回归森林树算法
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Python开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注Python)
最后
Python崛起并且风靡,因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低,但它的晋级路线很多,通过它你能进入机器学习、数据挖掘、大数据,CS等更加高级的领域。Python可以做网络应用,可以做科学计算,数据分析,可以做网络爬虫,可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多,你需要学好基础,再选择明确的方向。这里给大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
👉Python所有方向的学习路线👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
👉Python必备开发工具👈
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
👉Python全套学习视频👈
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
👉实战案例👈
学python就与学数学一样,是不能只看书不做题的,直接看步骤和答案会让人误以为自己全都掌握了,但是碰到生题的时候还是会一筹莫展。
因此在学习python的过程中一定要记得多动手写代码,教程只需要看一两遍即可。
👉大厂面试真题👈
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!
AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算
dnimg.cn/img_convert/99461e47e58e503d2bc1dc6f4668534a.png)
一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!
AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算