数据分析
文章平均质量分 80
AIGC人工智残
这个作者很懒,什么都没留下…
展开
-
数据分析——A/B测试二:优惠券AB测试项目
上文我们讲到A/B测试的简单流程,本次将通过实战来对A/B测试进行详细的讲解。原创 2023-10-17 10:16:10 · 326 阅读 · 0 评论 -
使用toad对数据进行分箱处理
Toad 是专为工业界模型开发设计的Python工具包,特别针对评分卡的开发。Toad 的功能覆盖了建模全流程,从 EDA、特征工程、特征筛选到模型验证和评分卡转化。Toad 的主要功能极大简化了建模中最重要最费时的流程,即特征筛选和分箱。一般分箱的折线图要实现单调的趋势,所以我们要调整分箱的箱数。0和1组存在倒挂,即badrate不单调,0和1进行合并。使用toad进行分箱,并输出分箱的内容。读取数据并查看数据基本内容。使用toad计算woe。原创 2023-07-31 15:53:58 · 1033 阅读 · 0 评论 -
模型构建——使用逻辑回归构建模型,lightGBM进行特征筛选
新的模型要跟原有方案对比,而且是通过实验证明,特别注意模型和策略不能同时调整。原创 2023-07-24 17:15:21 · 1432 阅读 · 0 评论 -
特征筛选——风控业务为例
特征的好坏直接影响到机器学习的效果,机器学习模型本身只能尽可能接近本身的上限,而特征工程决定了机器学习的上限。所以特征工程尤其重要。特征构造之后就要进行特征筛选。原创 2023-07-21 11:35:17 · 146 阅读 · 0 评论 -
机器学习实战——金融风控业务分析
以上数据信息可以看出,关键数据存在一定的缺失,需要根据实际情况进行填充,而日期数据需要转化为日期格式。对缺失数据进行填充,对时间数据进行日期转化。90天账单金额和未收金额,并讲这三组数据合并。计算账期60天的入催率和90天的入催率。添加季度特征项,准备数据分组。分析不同账期的资金回收情况。按季度对数据进行分组。原创 2023-07-12 11:08:01 · 161 阅读 · 2 评论 -
置信区间proportion_confint和z检验proportions_ztest的用法
以(近似)1-alpha的置信度的下限和上限置信区间。当返回Pandas对象时,取“count”的索引值。原创 2023-07-07 10:49:49 · 425 阅读 · 0 评论 -
数据分析——A/B测试及其实战
A/B测试是为 web 或 app 界面或流程制作两个(A/B)或多个版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。原创 2023-07-05 16:11:21 · 1019 阅读 · 0 评论