2024.4.24认知实习Day-3

i0kangkang0i

于 2024-04-25 00:00:16 发布

阅读量241

点赞数 3

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/i0kangkang0i/article/details/138170464

版权

数据预处理

因为不同数据表述的含义不同，将多个数据放在一块就会让人难以进行比较参考，这要是让模型进行学习，不得学废了。如果用官方的语言来说也就是，特征的单位或者大小相差较大，会影响目标的结果，使模型或者算法无法学到其他的特征。

为了解决这一=问题，就需要对数据进行预处理，常见的一般是归一化和标准化，

例如

上述方案就是对数据进行标准化处理后的结果。看吧，让数据变得特征更加明显了吧。

归一化

这需要运用数学的芝士了，也就是将多个数据特征转换成（0，1）之间，一般默认是这样的。

用python代码如何实现

调用数据归一化API，对上述数据data进行归一化处理，运行结果为:

算法实例讲解

对于每个特征，我们计算其最小值𝑋𝑚𝑖𝑛Xmin和最大值𝑋𝑚𝑎𝑥Xmax，然后将每个特征的值进行变换到[0, 1]的范围内。

对于给定的原始数据data：

90 2 10 40

60 4 15 45

75 3 16 46

我们计算每列特征的最小值和最大值如下

第一列特征的最小值为20，最大值为60，最大值为90

再套入上述归一化公式中就可以得出，这一列这一个特征值归一化的结果也就是1.0

对每一个特征重复进行上述操作即可得到这些特征归一化结果。

数据标准化

对数据进行处理将其转换成均值为0，标准差为1的标准正态分布数据。

科普一下标准差的求法：

用python代码如何实现

调用数据标准化API，对上述数据data进行标准化处理，运行结果为:

算法实例讲解

我们使用了StandardScaler对数据进行标准化处理。标准化是一种常见的数据预处理技术，它通过将数据转换为均值为0，标准差为1的标准正态分布来消除特征之间的量纲差异。

对于与给定的原始数据

90 2 10 40

60 4 15 45

75 3 13 46

我们使用StandardScaler对数据进行标准化处理，具体步骤如下：

计算每列特征的均值和标准差。
对每个特征的值进行标准化处理

得到结果就是上述运行的结果

对归一化和标准化的总结

项目实训，利用KNN算法对鸢尾花分类

实现流程：

-----获得数据集

-----数据基本处理

-----数据集处理（进行标准化处理）

-----模型训练

-----模型评估

-----模型预测

上述代码的运行结果如下

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
2024.4.24认知实习Day-3

数据预处理因为不同数据表述的含义不同，将多个数据放在一块就会让人难以进行比较参考，这要是让模型进行学习，不得学废了。如果用官方的语言来说也就是，特征的单位或者大小相差较大，会影响目标的结果，使模型或者算法无法学到其他的特征。为了解决这一=问题，就需要对数据进行预处理，常见的一般是归一化和标准化，例如上述方案就是对数据进行标准化处理后的结果。看吧，让数据变得特征更加明显了吧。归一化这需要运用数学的芝士了，也就是将多个数据特征转换成（0，1）之间，一般默认是这样的。用python
复制链接

扫一扫

i0kangkang0i CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

168万+: 周排名

19万+: 总排名

1017: 访问

: 等级

51: 积分

18: 粉丝

10: 获赞

2: 评论

19: 收藏

私信

关注

热门文章

最新评论

2024.4.22认知实习Day-1
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2024.4.24认知实习Day-3
CSDN-Ada助手: 恭喜用户在认知实习中坚持写下了第三篇博客！不断记录实习的心得体会是非常重要的，能够帮助自己更好地总结和提高。接下来，建议用户在博客中加入更多的具体案例和分析，让读者更容易理解和获得启发。希望用户能够继续保持创作的热情，不断进步！祝您写作顺利！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
2024.4.25认知实习Day-4
CSDN-Ada助手: 恭喜用户连续创作第四篇博客，“2024.4.25认知实习Day-4”！每日分享实习心得，不仅记录了自己的成长历程，也能给其他读者带来启发和帮助。建议用户在未来的创作中，可以尝试更深入地分析实习经历中的挑战和收获，或者结合理论知识进行更深入的探讨，让读者能够更全面地了解您的实习经历。期待用户的更多精彩内容，加油！愿您在实习中不断进步，收获更多宝贵经验！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。