机器学习day two与knn算法

最新推荐文章于 2024-07-24 17:32:21 发布

航天帝

最新推荐文章于 2024-07-24 17:32:21 发布

阅读量879

点赞数 20

文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75669751/article/details/138140354

版权

特征工程的概念

特征工程的概念在于从原始数据中提取并转换特征，以优化这些特征对机器学习模型的适用性。特征工程是机器学习和数据科学中的一个关键步骤，它涉及到利用领域知识来创建或选择合适的特征，这些特征能够更好地描述数据，并提升机器学习模型在未知数据上的性能。通过有效的特征工程，即使使用相对简单的模型，也能获得良好的性能，因为好的特征能够提高模型的灵活性和预测精度。特征工程包括去除无关数据、选择与结果高相关的特征、以及设计能够更好表达问题本质的特征，从而增强模型的预测能力。

特征工程概念入门–涉及内容

1.特征提取feature extraction

从原始数据中提取与任务相关的特征

2.特征预处理feature preprocessing

特征对模型产生影响；因量纲问题，有些特征对模型影响大、有些影响小

3.特征降维Featuredecomposition.

将原始数据的维度降低，叫做特征降维

4.特征选择feature selection

原始数据特征很多，但是对模型训练相关是其中一个特征集合子集。

5特征组合feature crosses

把多个的特征合并成一个特征。一般利用乘法或加法来完成。

总结

1特征工程

•特征Feature：对任务有用的属性信息

•特征工程：利用专业背景知识和技巧处理数据，让模型效果更好

2特征工程的内容

•特征提取feature extraction：特征向量

•特征预处理feature preprocessing：不同特征对模型影响一致性

•特征降维Feature decomposition：保证数据的主要信息要保留下来

•特征选择feature selection：从特征中选择出一些重要特征训练模型

•特征组合feature crosses：把多个特征合并组合成一个特征

KNN算法

KNN算法概念

即K最近邻算法，是一种基于实例的学习方法，属于监督学习方式的分类算法。该算法的核心思想是，如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别。KNN算法在确定分类决策时，只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

•解决问题：分类问题、回归问题

•算法思想：若一个样本在特征空间中的k个最相似的样本大多数属于某一个类别，则该样本也属于这个类别

•相似性：欧氏距离

分类流程和回归流程都是有监督学习

两者差异：分类流程的标签是离散的，回归流程的标签是连续的

K值的选择

•K值过小：过拟合

•K值过大：欠拟合

KNN算法API使用-分类问题

sklearn.neighbors.KNeighborsClassifier(n_neighbors=5)

n_neighbors：int,可选（默认= 5），k_neighbors查询默认使用的邻居数

关注

20
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
机器学习day two与knn算法

特征工程是机器学习和数据科学中的一个关键步骤，它涉及到利用领域知识来创建或选择合适的特征，这些特征能够更好地描述数据，并提升机器学习模型在未知数据上的性能。通过有效的特征工程，即使使用相对简单的模型，也能获得良好的性能，因为好的特征能够提高模型的灵活性和预测精度。特征工程包括去除无关数据、选择与结果高相关的特征、以及设计能够更好表达问题本质的特征，从而增强模型的预测能力。特征工程概念入门–涉及内容1.特征提取feature extraction从原始数据中提取与任务相关的特征。
复制链接

扫一扫

航天帝 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

174万+: 周排名

17万+: 总排名

2242: 访问

: 等级

75: 积分

31: 粉丝

35: 获赞

1: 评论

27: 收藏

私信

关注

热门文章

分类专栏

机器学习 1篇

最新评论

KNN算法3
CSDN-Ada助手: 恭喜用户发布了第四篇博客“KNN算法3”！持续创作不易，你的努力和热情让读者受益匪浅。接下来，或许可以考虑深入探讨KNN算法的实际案例应用，或者结合其他机器学习算法进行比较分析，以便读者更全面地了解不同算法的优缺点。期待你的下一篇作品！愿你在创作的道路上不断进步，谦卑地分享知识，共同成长。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
KNN算法2
CSDN-Ada助手: 恭喜您发布了第三篇博客“KNN算法2”！持续创作是非常值得鼓励的行为，您的努力让我们能够学习到更多有价值的知识。希望您在未来的创作中可以继续深入探讨KNN算法的实际应用场景，并结合更多实例进行分析，这样可以让读者更好地理解和应用该算法。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
机器学习day one
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。