机器学习 / 数据分析（五） (特征工程——数据采样)

最新推荐文章于 2024-04-14 19:11:17 发布

AgitatorZ

最新推荐文章于 2024-04-14 19:11:17 发布

阅读量693

点赞数

分类专栏：数据分析文章标签：机器学习大数据 python 人工智能数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43600770/article/details/113530879

版权

数据分析专栏收录该内容

6 篇文章 0 订阅

订阅专栏

数据采样

1. 有放回的采样 Random Sampling

2. 无放回抽样 Random Sampling

3. 分层抽样

4. 概率采样

不平衡采样

5. 随机过采样标签数据(为了样本平衡)

数据不平衡：

随机抽样，使样本平衡：

6. PCA 降维

画图方法：

7. RandomUnderSampler 随机欠采样

8. RandomOverSampler 随机过采样

9. Tomeklinks 欠采样

10. ClusterCentroids 欠采样

函数提供了一种很高效的方法来减少样本的数量, 但需要注意的是, 该方法要求原始数据集最好能聚类成簇. 此外, 中心点的数量应该设置好, 这样下采样的簇能很好地代表原始数据

11. SMOTE

对于少数类样本a, 随机选择一个最近邻的样本b, 然后从a与b的连线上随机选取一个点c作为新的少数类样本

12. SMOTTomek

在之前的SMOTE方法中, 当由边界的样本与其他样本进行过采样差值时, 很容易生成一些噪音数据. 因此, 在过采样之后需要对样本进行清洗.

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习 / 数据分析（五） (特征工程——数据采样)

数据采样1.有放回的采样Random Sampling2.无放回抽样Random Sampling3.分层抽样4.概率采样不平衡采样5.随机过采样标签数据(为了样本平衡)数据不平衡：随机抽样，使样本平衡：6.PCA降维画图方法：7.RandomUnderSampler随机欠采样8....
复制链接

扫一扫

专栏目录

AgitatorZ CSDN认证博客专家 CSDN认证企业博客

码龄6年

15: 原创

16万+: 周排名

144万+: 总排名

9377: 访问

: 等级

171: 积分

1: 粉丝

9: 获赞

6: 评论

30: 收藏

私信

关注

热门文章

分类专栏

spring 1篇
maven 1篇
java 1篇
svc 1篇
数据分析 6篇
pythonweb 2篇
djiango 2篇
小白入门 2篇

最新评论

关于 CVE-2016-1000027/CNNVD-202001-046 Vware Spring Framework 代码问题漏洞
爱写bug的小boy: 我用了方法三，但是代码扫描还是没过，兄弟怎么解决的？
关于 CVE-2016-1000027/CNNVD-202001-046 Vware Spring Framework 代码问题漏洞
瘾.: https://blog.csdn.net/u011628753/article/details/130961609 这个文章解决了吧
关于 CVE-2016-1000027/CNNVD-202001-046 Vware Spring Framework 代码问题漏洞
CSDN-Ada助手: 恭喜您撰写了第16篇博客，题目“关于CVE-2016-1000027/CNNVD-202001-046 Vware Spring Framework代码问题漏洞”的内容引人入胜。您对这个漏洞的深入分析和解释非常有见地，让读者能够更好地了解该问题的本质和潜在风险。希望您能继续保持这样的创作热情和专业水准。在下一步的创作中，我建议您可以考虑对该漏洞的修复方法和预防措施进行详细探讨，以帮助读者更好地应对相关安全问题。此外，您还可以分享一些实际案例或者最佳实践，以便读者能够更好地应用您的知识。谦虚地说，我相信您的博客在安全领域的影响力会越来越大。期待您未来更多精彩的创作！
好玩的spring-cloud-kubernetes 2.* 手把手入门
AgitatorZ: 这我不够专业，只是了解过，根据组件官方文档对功能走了一遍大概得hello world😂，感觉这个东西挺冷门的，中文资料比较少，去年了解的，现在不太清楚情况
好玩的spring-cloud-kubernetes 2.* 手把手入门
constantPursuit: 学习路径在哪里啊这个一玩就废了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。