数据分析
文章平均质量分 57
MYFFZ
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pandas筛选技巧:lt/gt/eq/ne/le/ge/between全解析
Pandas中比较运算符的核心用法原创 2025-10-16 15:35:31 · 249 阅读 · 0 评论 -
scorecardpy 库woebin函数详解
woebin函数是一个用于最优分箱的工具,支持数值型、因子型和分类变量的分箱处理。主要功能包括:1)基于树形分割或卡方合并生成最优分箱;2)支持自定义分箱断点和特殊值处理;3)计算WOE值(证据权重)。关键参数包括:dt(输入数据框)、y(目标变量)、x(待分箱变量)、breaks_list(自定义断点)、stop_limit(分箱停止阈值)和method(分箱方法)。该函数还提供并行计算、缺失值处理和分箱规则保存等实用功能,适用于信用评分等预测模型的变量分箱需求。原创 2025-09-29 10:58:45 · 749 阅读 · 0 评论 -
scorecardpy 库woebin 函数
摘要:woebin是信用评分卡开发的核心工具,用于特征分箱和计算WOE/IV值。它支持数值型和分类型特征,提供tree和chimerge两种分箱方法,可自定义分箱规则和约束条件。关键参数包括目标变量设置、分箱停止阈值、最小分箱占比等,能平衡统计最优性和业务可解释性。输出结果包含分箱区间、样本分布、WOE和IV值,适用于信用评分建模、特征筛选和风控规则制定。该工具通过参数组合可灵活处理特殊值,并实现分箱结果的可视化和复用。原创 2025-09-29 10:42:00 · 384 阅读 · 0 评论 -
python-批量将文件复制到另一个路径
【代码】python-批量将文件复制到另一个路径。原创 2025-05-04 23:17:45 · 349 阅读 · 0 评论 -
数据保存为Feather 和 Parquet格式
还在使用csv?试试更快的储存和读取方式。原创 2025-03-04 19:58:40 · 1081 阅读 · 0 评论 -
常用的一些python数据分析函数-记录
rank()是 Pandas 中的一个函数,用于为数据进行排名。它会为每个元素分配一个排名值,其中排名值越小表示越靠前。在使用 .rank()函数时,可以使用method和ascending参数来调整排名的方法和排序顺序。methodaverageminmaxfirst以下是一个示例代码,展示如何使用methodTrueFalse以下是一个示例代码,展示如何使用ascending。原创 2024-09-03 18:32:51 · 2285 阅读 · 0 评论 -
Excel:缺失值使用前值填充
选中E列(就是你需要填充的那一列),摁F5(或者Ctrl+G),定位条件,选择“空值”,确定,输入=,然后摁键盘上向上的方向键,ctrl+enter结束。下载了点金融数据到excel表格里,导出的交易日宏观经济数据,在数据对齐后有一些缺失值,使用前值填充就行,懒得再导进python了,发现excel也同样好用。原创 2024-01-16 10:07:58 · 1400 阅读 · 1 评论
分享