金融风控训练营Task03笔记

最新推荐文章于 2024-09-07 18:59:08 发布

Ag+Cu

最新推荐文章于 2024-09-07 18:59:08 发布

阅读量149

点赞数

分类专栏：金融风控学习笔记文章标签：数据挖掘机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43695233/article/details/116223039

版权

金融风控学习笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

学习知识点概要

特征值处理
- 缺失值补充
- 时间格式处理
- 类别特征处理
异常值处理
数据分桶
特征交互
特征编码
特征选择

学习内容

特征值处理

查找特征
.select_dtypes()：根据数据类型选择特征
缺失值填充
.fillna()：用字典填充
时间格式处理
.striptime()：根据指定的格式把一个时间字符串解析为时间元组
类别特征处理
.nunique()：返回唯一值得个数

异常值处理

均方差

数据分桶

特征分箱的目的：
降低变量的复杂性，减少变量噪音的影响，提高自变量和因变量的相关性

数据分桶的对象：
连续变量离散化
多状态的连续变量合并成少状态

分箱的原因：
数据的特征内的值跨度比较大时

分箱的优点：

处理缺失值
处理异常值
业务解释性

特征编码

labelEncode

特征选择

精简掉无用特征，降低最终模型的复杂性，保证准确率的情况下提高速度。

问题与解答

暂无

思考与总结

通过这次学习，我了解到了如何用python编写函数计算特征值，也学习到了如何对特征进行预处理，这对我之后的数据分析学习提供了很大的帮助，我会继续努力，掌握这项技能。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
金融风控训练营Task03笔记

学习知识点概要特征值处理缺失值补充时间格式处理类别特征处理异常值处理数据分桶特征交互特征编码特征选择学习内容特征值处理查找特征.select_dtypes()：根据数据类型选择特征缺失值填充.fillna()：用字典填充时间格式处理.striptime()：根据指定的格式把一个时间字符串解析为时间元组类别特征处理.nunique()：返回唯一值得个数异常值处理均方差数据分桶特征分箱的目的：降低变量的复杂性，减少变量噪音的影响，提高自变量和因变量的相关
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ag+Cu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。