5.16特征提取

最新推荐文章于 2024-11-09 20:38:27 发布

Shirleyluck

最新推荐文章于 2024-11-09 20:38:27 发布

阅读量618

点赞数 12

文章标签： scikit-learn 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shirleyluck/article/details/138973994

版权

对于数据进行处理的时候如何进行特征提取？有什么类型?怎么提取更加科学，怎么检验提取的特征是不是好特征，能不能分辨不同？

正好本学期在学概率论与数理统计部分，虽然目前还学得很浅，不知道怎么用。想起大一下学期学线性代数的时候做的人脸识别，里面的特征提取，PCA主成分分析方法什么的实际上基本没有掌握，基本就是cv工程，害。

常见特征提取

原始的材料主要就是数据、文本、图像三类。

统计特征提取方法可以用于数据预处理阶段，帮助我们更好地理解和描述数据的特征，为后续的建模和分析工作奠定基础。同时，统计特征也可以作为特征工程的一部分，通过对数据集的统计学特性进行提取和分析，来构建更加有效的特征表示。（均值、方差等）

文本特征词袋模型和TF-IDF

图像特征：边缘检测和颜色直方图

在深度学习中，特征提取既可以手动设计，也可以通过自动学习获取。手动设计特征需要领域专家的知识和经验，并且需要不断调整和优化，而自动学习特征则可以通过训练大规模数据集和深度神经网络来实现。自动学习特征可以有效地降低人工特征设计的工作量，并且能够获得更好的特征表示。

常用特征提取方法详解：统计特征、文本特征、图像特征，见以下链接：

https://wenku.csdn.net/column/1d59a1v96ohttps://wenku.csdn.net/column/1d59a1v96o

发现好多用这个scikit-learn进行处理的，在此先标记一下

官网：

scikit-learn中文社区Scikit-learn（以前称为scikits.learn，也称为sklearn）是针对Python 编程语言的免费软件机器学习库。它具有各种分类，回归和聚类算法，包括支持向量机，随机森林，梯度提升，k均值和DBSCAN。Scikit-learn 中文文档由CDA数据科学研究院翻译，扫码关注获取更多信息。https://scikit-learn.org.cn/

sklearn是机器学习中一个常用的python第三方模块，对常用的机器学习算法进行了封装其中包括： 1.分类（Classification） 2.回归（Regression） 3.聚类（Clustering） 4.数据降维（Dimensionality reduction） 5.常用模型（Model selection） 6.数据预处理（Preprocessing）本文将从sklearn的安装开始讲解，由浅入深，逐步上手sklearn。

十分钟上手sklearn：安装，获取数据，数据预处理 - 知乎sklearn是机器学习中一个常用的python第三方模块，对常用的机器学习算法进行了封装其中包括： 1.分类（Classification） 2.回归（Regression） 3.聚类（Clustering） 4.数据降维（Dimensionality reduction） 5.…https://zhuanlan.zhihu.com/p/105039597

十分钟上手sklearn：特征提取，常用模型，交叉验证 - 知乎这一篇虽然叫做：十分钟上手sklearn：特征提取，常用模型，但是写着写着我就想把每一个模型都详细说一下，所以也可以看作是机器学习算法概述了。主要内容包括： 1.PCA算法 2.LDA算法 3.线性回归 4.逻辑回归 5.朴…https://zhuanlan.zhihu.com/p/105041301

第二个链接主要讲的：

1.PCA算法 2.LDA算法 3.线性回归 4.逻辑回归 5.朴素贝叶斯 6.决策树 7.SVM 8.神经网络

关注

12
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Shirleyluck CSDN认证博客专家 CSDN认证企业博客

码龄2年

36: 原创

120万+: 周排名

5万+: 总排名

2万+: 访问

: 等级

819: 积分

342: 粉丝

462: 获赞

6: 评论

454: 收藏

私信

关注

热门文章

最新评论

5.23相关性分析
CSDN-Ada助手: 恭喜您撰写了第20篇博客“5.23相关性分析”！持续创作不易，您的努力和热情让我们受益良多。希望您在未来的创作中可以更深入地探讨相关性分析的应用领域，或者结合实际案例进行分析，这样可以让读者更加深入地理解这一概念。期待您的下一篇作品！
5.22R语言初步学习-1
CSDN-Ada助手: 恭喜您写了第17篇博客！看到您正在学习R语言初步，我感到非常欣慰，因为R语言在数据分析领域有着重要的应用。建议您在下一篇博客中可以分享一些实际案例或者学习心得，让读者更加深入了解R语言的应用和特点。希望您能坚持写作，不断提升自己的技能和经验，期待您更多精彩的分享！祝您学习进步，写作顺利！
5.22 R语言-正态性检验
CSDN-Ada助手: 恭喜您发布了新的博客！看到您在探讨R语言中的正态性检验，内容十分有趣且实用。希望您能继续保持创作的热情，为大家分享更多有价值的知识。或许在下一篇博客中，您可以尝试探讨一些高级的统计分析方法，或者分享一些实际案例的应用经验，这样能够让读者更深入地了解相关领域。期待您的下一篇作品！
5.17+5.18 MPU6050之IIC通信及直接数据
CSDN-Ada助手: 恭喜您写下了第12篇博客，内容涉及到MPU6050的IIC通信及直接数据，非常值得称赞！希望您能继续保持创作的热情和耐心，坚持不懈地分享您的学习和经验。下一步可以考虑深入探讨MPU6050在实际项目中的应用场景，或者结合其他传感器进行更深入的探索，期待您的更多精彩内容！愿您在探索的道路上不断进步，谦虚地接受各种建议与意见。
BY9301-16P语音播报
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。