算法优化-少数样本处理

最新推荐文章于 2023-03-23 10:49:15 发布

zhuimeng999

最新推荐文章于 2023-03-23 10:49:15 发布

阅读量608

点赞数

文章标签：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhuimeng999/article/details/80296959

版权

在检测少数样本时，如果我们采用正常的分类评价指标，则会发现，即使少数类全部分错，也能达到一个很高的正确率。所以我们在这种情况下需要另外的策略保证少数类得到足够的重视

再抽样
1.1 对多数类随机欠采样
- 缺点：数据集没有完全被利用，而且有可能引入偏差
弥补：
集成学习：
- EasyEnsemble: 并联方式，将多数类分成n组分别与少数类一起学习，然后综合结果
- BlanceCascade: 串联方式。将多数类分成n组，取一组与少数类一起学习，然后将学习差的样本与下一组一起学习，迭代知道满足特定的条件
1.2 对少数类随机过采样
-缺点：容易过拟合
弥补：smote方法，采用插值的方式填补，而不是直接复制
算法
2.1 对类别错误施加惩罚，少数类分错给与更大的惩罚，即采用贝叶斯最小化平均风险，而不是最小化错误率
2.1.1 代价矩阵

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

zhuimeng999 CSDN认证博客专家 CSDN认证企业博客

码龄13年

15: 原创

36万+: 周排名

149万+: 总排名

2万+: 访问

: 等级

418: 积分

2: 粉丝

6: 获赞

7: 评论

23: 收藏

私信

关注

热门文章

分类专栏

大数据学习 1篇

最新评论

推荐系统-SVD/LFM基于模型的协同过滤
weired_cat 回复 weired_cat: 好像SVD就是SVD分解。。直接矩阵分解就行了。博主所说的SVD大量参数是什么意思呢？
推荐系统-SVD/LFM基于模型的协同过滤
weired_cat: 博主，所以说这里的SVD和线性代数的SVD并不是同样的用法是吗？其实只是借助了这样的表达形式？P矩阵、sigma矩阵、Q矩阵里的每一个参数都是通过训练得到？而将svd这样的形式简化为下面的只剩下用户特征和物品特征的模型，就是LFM模型?同样，所有参数都通过训练得到
推荐系统-SVD/LFM基于模型的协同过滤
zhuimeng999 回复小小酥_LH: 我觉得不是，这两个思想各有其独立性，我不认为有谁包含了谁。不过我觉得矩阵分解应该包含了协同过滤的一部分
推荐系统-SVD/LFM基于模型的协同过滤
小小酥_LH 回复 zhuimeng999: 谢谢博主耐心解答，认真看了几遍，对LFM又有了更清晰的认识。。。可能是我理解有点偏差了
推荐系统-SVD/LFM基于模型的协同过滤
zhuimeng999 回复小小酥_LH: 有点类似，协同过滤大致是相似的人或物会产生相似的行为，但lfm实质是一种隐变量思想。lfm假定人或物的属性可以被量化，即表达为用户矩阵和物品矩阵，一旦把人和物数据化，lfm继续假定人对物的评价可以借由矩阵乘法得到，即用户矩阵乘以物品矩阵。这就是名称中模型的含义，在这个模型下，利用评价矩阵中部分已知的数据，加上一些正则控制复杂度，倒推回去得到用户矩阵和物品矩阵。在做一次正向计算，便可以得到评价矩阵中缺失的部分。仔细考虑模型的思想，用户矩阵和物品矩阵为隐变量。同时协同过滤实质被隐含在了计算中，但绝不是全部。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。