sklearn数据预处理与决策树的实现

最新推荐文章于 2024-08-19 09:14:51 发布

m0_74797638

最新推荐文章于 2024-08-19 09:14:51 发布

阅读量98

点赞数 1

文章标签： sklearn 决策树人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74797638/article/details/134186444

版权

make_blobs主要是为了生成分类或者聚类数据集的

n_features表示每一个样本有多少特征值

n_samples表示样本的个数

centers是聚类中心点的个数，可以理解为label的种类数

random_state是随机种子，可以固定生成的数据

cluster_std设置每个类别的标准差，默认为1

shuffle：洗牌

将数据缩放至指定的范围内

class sklearn.preprocessing.MinMaxScaler(feature_range=(0,1),copy=True)

将数据的最大值缩放至1

class sklearn.preprocessing.MaxAbsScaler(copy=True)

数据的Normalization---向量单位化

sklearn.preprocessing.normalize(

X,axis=1,copy=True

norm = 'l2':'l1','l2',or 'max',用于正则化的具体范数

return_norm = False:是否返回所使用的范数

)

稳健标准化

将中位数和百分位数（默认使用四分位间距）分别代替均数和标准差用于数据的标准化。

sklearn.preprocessing.robust_scale(

X,axis=0,with

)

S折交叉验证(S-fold cross validation)

S:超参数，把数据分成多少份

留一交叉验证(LOOCV,Leave one out cross validation)

LOOCC是保留一个数据点，同样的你也可以保留P个数据的作为验证集，这种方法叫LPOCV

Sklearn交叉验证常用命令

sklearn.model_selection:cross_val_score#将拆分与评价合并执行

               cross_validate#同时使用多个评价指标

               cross_val_predict#使用交互验证后的模型进行预测

sklearn决策树

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
sklearn数据预处理与决策树的实现

make_blobs主要是为了生成分类或者聚类数据集的n_features表示每一个样本有多少特征值n_samples表示样本的个数centers是聚类中心点的个数，可以理解为label的种类数random_state是随机种子，可以固定生成的数据cluster_std设置每个类别的标准差，默认为1shuffle：洗牌将数据缩放至指定的范围内将数据的最大值缩放至1。
复制链接

扫一扫

m0_74797638 CSDN认证博客专家 CSDN认证企业博客

码龄2年

9: 原创

145万+: 周排名

14万+: 总排名

6769: 访问

: 等级

223: 积分

83: 粉丝

133: 获赞

4: 评论

103: 收藏

私信

关注

热门文章

最新评论

FP增长算法
CSDN-Ada助手: 恭喜您写完了第6篇博客！标题“FP增长算法”引起了我的兴趣。您在这篇博客中分享了什么关于FP增长算法的见解呢？我很期待能够从您的博客中学到更多有关这个算法的知识。希望您能够继续保持创作的热情，为我们带来更多有价值的内容。如果我能提一个谦虚的建议的话，希望您能在下一篇博客中深入探讨一下这个算法的应用场景和可能的优化方法。期待您的下一篇作品！
Apriori关联分析
CSDN-Ada助手: 恭喜您写了第5篇博客，标题为：“Apriori关联分析”！您的持续创作让我们受益匪浅，非常感谢您的分享。接下来，我建议您可以考虑深入探讨一些实际案例，或者结合其他数据挖掘算法进行比较分析，这样可以为读者提供更多的学习参考。希望您能继续保持创作热情，期待您更多精彩的文章！
MNIST手写数字识别sklearn实践
CSDN-Ada助手: 恭喜作者在博客中分享了关于MNIST手写数字识别的实践经验！阅读了您的博客后，我对sklearn在数字识别方面的应用有了更深入的理解。不过，我想提醒作者，在下一篇博客中可以尝试结合深度学习模型，比如使用TensorFlow或PyTorch来实现手写数字识别，这样可以让读者对不同方法有更全面的了解。期待作者的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
利用CART算法建立决策树
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“利用CART算法建立决策树”听起来非常有趣和有深度。很高兴看到您对这个话题有深入研究并能够分享您的见解。您的文章内容肯定会对那些对决策树和CART算法感兴趣的读者有所启发。对于下一步的创作建议，我建议您可以进一步探索决策树算法在实际应用中的案例和问题。比如，您可以探讨决策树在数据挖掘、机器学习或者商业决策等领域的具体应用。此外，您可以考虑与其他相关算法进行对比，以便读者能够更全面地了解决策树算法的优势和局限性。再次感谢您的分享，并期待您未来更多精彩的博客文章！祝您继续创作愉快！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
sklearn数据预处理与决策树的实现
CSDN-Ada助手: 恭喜您开始博客创作！标题“sklearn数据预处理与决策树的实现”听起来非常有趣和实用。数据预处理和决策树是机器学习中非常重要的话题，您选择这个主题是明智的。在您的博客中，您可以进一步介绍sklearn在数据预处理方面的功能和如何使用决策树来解决实际问题。此外，您可以考虑包括一些示例代码和实际案例，这将帮助读者更好地理解和应用所学内容。期待您在下一篇博客中的精彩内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。