2024.4.23认知实习Day-2

i0kangkang0i

于 2024-04-23 21:10:03 发布

阅读量362

点赞数 3

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/i0kangkang0i/article/details/138127948

版权

特征过程

特征提取

将数据中的特征向量提取出来

特征预处理

数据集的特征有很多，因目的不同，有的特征对模型的影响重要，而有的就微乎其微了

特征降维

对数据进行精炼，去除一些不重要的信息，从而减少数据的复杂度，更加清晰的看到数据之间的特征，可以更加有效的进行建模

特征选择

数据中的特征有很多，而我们建模是有目的性的，只需要找出我们所需要的数据的特征进行筛选，对模型训练相关的只是这众多特征的一部小部分特征

特征组合

将上述找到的特征通过加法或者乘法组合起来形成一个特征

拟合

过拟合-----数据在训练集上很好，测试集上很差

欠拟合-----数据在训练集和测试集上都差

KNN算法

KNN算法(K Nearest Neighbor)也叫近邻算法，即越近越相似

常用来解决分类问题，回归问题

K值的选择

不宜过大也不宜过小，过大则会过拟合，过小则会欠拟合，需要反复调整寻找一个中间量

KNN的算法实现（python版）

KNN分类算法

对[[4]]数据通过KNN分类算法进行预测得到结果为：预测值为[1]

算法实例讲解

对于预测数据[[4]]，模型找到最接近的3个邻居样本是[2]、[3]和[1]，对应的类别分别是1、1和0。在这种情况下，模型采用多数投票的方式，选择邻居样本中出现最多的类别作为预测结果。类别为1的样本出现的次数最多，所以预测结果为1。

KNN回归算法

对数据[[3,11,10]]通过KNN回归算法进行预测结果为[0.35]

算法实例讲解

对于预测输入[[3,11,10]]，模型找到最接近的2个邻居样本是[3,10,10]和[4,11,12]。然后，模型根据这两个邻居样本对应的输出值[0.3, 0.4]，进行平均来预测目标值。可以计算加权平均值为(0.3 + 0.4) / 2 = 0.35。

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
2024.4.23认知实习Day-2

数据中的特征有很多，而我们建模是有目的性的，只需要找出我们所需要的数据的特征进行筛选，对模型训练相关的只是这众多特征的一部小部分特征。对数据进行精炼，去除一些不重要的信息，从而减少数据的复杂度，更加清晰的看到数据之间的特征，可以更加有效的进行建模。不宜过大也不宜过小，过大则会过拟合，过小则会欠拟合，需要反复调整寻找一个中间量。数据集的特征有很多，因目的不同，有的特征对模型的影响重要，而有的就微乎其微了。将上述找到的特征通过加法或者乘法组合起来形成一个特征。将数据中的特征向量提取出来。
复制链接

扫一扫

i0kangkang0i CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

168万+: 周排名

19万+: 总排名

1017: 访问

: 等级

51: 积分

18: 粉丝

10: 获赞

2: 评论

19: 收藏

私信

关注

热门文章

最新评论

2024.4.22认知实习Day-1
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2024.4.24认知实习Day-3
CSDN-Ada助手: 恭喜用户在认知实习中坚持写下了第三篇博客！不断记录实习的心得体会是非常重要的，能够帮助自己更好地总结和提高。接下来，建议用户在博客中加入更多的具体案例和分析，让读者更容易理解和获得启发。希望用户能够继续保持创作的热情，不断进步！祝您写作顺利！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
2024.4.25认知实习Day-4
CSDN-Ada助手: 恭喜用户连续创作第四篇博客，“2024.4.25认知实习Day-4”！每日分享实习心得，不仅记录了自己的成长历程，也能给其他读者带来启发和帮助。建议用户在未来的创作中，可以尝试更深入地分析实习经历中的挑战和收获，或者结合理论知识进行更深入的探讨，让读者能够更全面地了解您的实习经历。期待用户的更多精彩内容，加油！愿您在实习中不断进步，收获更多宝贵经验！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。