- 博客(62)
- 收藏
- 关注
原创 ABTest如何计算最小样本量-工具篇
计算样本量有4个要输入的参数:①一类错误概率,②二类错误概率 (一般是取固定取值),③指标初始比例,④最小可检测效果
2024-04-25 22:47:02
824
原创 [皮尔逊相关系数corrwith]使用案例:电影推荐系统
用corrwith()函数计算物品间的皮尔逊相关系数,基于物品的协同过滤算法,制作简单的电影推荐系统。
2023-06-23 21:52:56
458
2
原创 Python机器学习:roc_curve()生成ROC曲线
用sklearn里面的roc_curve()函数,就能一键计算FPR和TPR,快速生成ROC曲线啦。
2023-02-11 00:54:12
6102
4
原创 详解准确率acc、精确率p、准确率acc、F1 score
准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 Score
2023-02-09 23:58:47
6240
原创 Python机器学习:plot_importance()查看特征重要度
lightgmb算法里面的plot_importance()方法支持特征重要度的查看,另外xgboost算法的实现也几乎一样哦。
2023-02-06 23:45:38
5247
3
原创 Python机器学习:时间多尺度处理日期变量
月份、季节、周末等因素可能对结果的预测有影响,需要自行加工把特征添加到数据集里。使用month 、weekday等时间属性可以把特征处理出来。
2023-01-27 23:00:57
636
原创 Python机器学习:自定义函数筛选相关性高的特征
当特征有很多的时候,难免会出现一些相关性高的特征。可以自定义一个自动化的方法批量输出这些特征,方便我们进行下一步删除或者降维的处理。
2023-01-20 00:10:44
1876
2
原创 Python机器学习:corr()探索自变量与因变量的相关性
相关矩阵corr()探索相关关系,sort_values()将数据从大到小排序,用plot()对数据进行可视化
2023-01-18 23:11:15
3210
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人