项目常用技巧

最新推荐文章于 2023-01-05 20:33:23 发布

超人睡不着也变无奈

最新推荐文章于 2023-01-05 20:33:23 发布

阅读量148

点赞数

分类专栏：机器学习文章标签：常用技巧

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XINGBAIDE/article/details/85562998

版权

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

1.样本不均衡
过采样或者下采样

下采样：
让样本同样少

过采样：
生成数据使得样本一样多
SMOTE算法：
在这里插入图片描述

2.保持各特征分布有差不多的范围：
保证不同特征的取值跨度相同，保持重要程度相同

3.交叉验证
训练集
验证集
测试集
交叉验证：求稳

比如，训练集拆成3份，1+2-》训练，3验证，1+3-》训练，2验证，2+3训练，1验证
再求平均

4.模型评估方法
精度 num(y^=y)/num(all)

Recall 召回率： TP/(TP+TF)
TP:正类判为正类
FP:负类判为正类
FN:正类判为负类
TN:负类判为负类

5.正则化惩罚项
希望泛化能力强，避免过拟合
则加入正则化惩罚项，一般用L2正则化方法

6.混淆矩阵
X轴是predicted label
Y轴是real label
分成四个块，就是个看recall值的图

超人睡不着也变无奈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
项目常用技巧

1.样本不均衡过采样或者下采样下采样：让样本同样少过采样：生成数据使得样本一样多SMOTE算法：2.保持各特征分布有差不多的范围：保证不同特征的取值跨度相同，保持重要程度相同3.交叉验证训练集验证集测试集交叉验证：求稳比如，训练集拆成3份，1+2-》训练，3验证，1+3-》训练，2验证，2+3训练，1验证再求平均4.模型评估方法精度 num(y^=y)/nu...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。