ML project procedure

ML project procedure

【基于唐宇迪老师python数据分析与机器学习实战【2019新版】逻辑回归-信用卡检测任务】

1. 处理缺失特征值
		均值插补、同类均值插补、建模预测、高维映射、多重插补、极大似然估计、压缩感知、矩阵补全
		
2. 文本特征值化
		特征二元化(中文数据类型转换)、独热编码(One-HotEncoding)
		
3. 标准化 (所有数据)
		标准化:减小特征值自身数量级差异的影响( x - μ / σ == 中心化+缩放--> z-score 标准化)
		=StandardScaler().fit_transform(xxxx)
		
4. 特征选择(feature selection -- 选取有效特征)
		过滤法(Filter):按发散性or相关性对各个特征进行评分,设定阈值or待选择阈值的个数,选择特征
				a. 去掉取值变化小的特征(Removing features with low variance)
				b. 单变量特征选择 (Univariate feature selection)
		包裹法(Wrapper):根据目标函数,每次选择若干特征或者排除若干特征,直到选择出最佳的子集。
				a. 递归特征消除 (Recursive Feature Elimination)
		嵌入法(Embedding):先用ML算法和模型训练,评分类似Filter,但通过训练来确定特征的优劣
				a. 使用SelectFromModel选择特征 (Feature selection using SelectFromModel)
				b. 将特征选择过程融入pipeline (Feature selec
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值