机器学习（三）

·w·920

已于 2023-10-08 21:54:18 修改

阅读量38

点赞数

文章标签：机器学习

于 2023-10-08 21:03:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63697837/article/details/133688673

版权

机器学习基础

1.算法是核心，数据和计算是基础

2.找准定位

机器学习算法的判别依据

数据类型

离散型数据：由记录不同类别个体的数目所得到的数据，又称计数数据，所有这些数据全部都是整数，而且不能再细分，也不能进一步提高精确度

连续性数据：变量可以在某个范围内取任一数，即变量的取值可以是连续的，如长度、时间、质量值等，这类整数通常是非整数，含有小数部分

（只要记住一点，离散型是区间内不可分，连续型是区间内可分）

机器学习算法分类

监督学习（预测）（特征值+目标值）

1.分类 k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络

2.回归线性回归、岭回归

3.标注隐马尔可夫模型

分类：目标值离散型；回归：目标值连续型

无监督学习（特征值）

1.聚类 k-means

监督学习

可以由输入数据中学到或建立一个模型，并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归)，或是输出是有限个离散值 (称作分类)。

分类是监督学习的一个核心问题，在监督学习中，当输出变量取有限个离散值时，预测问题变成为分类问题。最基础的便是二分类问题，即判断是非，从两个类别中选择一个作为预测结果

回归是监督学习的另一个重要问题。回归用于预测输入变量和输出变量之间的关系，输出是连续型的值。

无监督学习

可以由输入数据中学到或建立一个模型，并依此模式推测新的结果。输入数据是由输入特征值所组成

机器学习的开发流程

1.建立模型：根据数据类型划分应用种类

2.数据的基本处理：pd去处理数据（缺失值，合并表......）

3.特征工程（特征进行处理）

4.找合适算法去进行预测

模型：算法+数据

5.模型的评估，判定效果

6.上线使用：以API形式提供

分类算法

k-近邻算法（KNN）

定义：如果一个样本在特征空间中的k个最相似（即特征空间中最邻近）的样本中大多数属于某一个类别，则该样本也属于这个类别

相似的样本，特征之间的值应该都是相近的

K-近邻算法：需要做标准化处理

若k值取很小：容易受异常点影响

若k值取很大：容易受k值数量（类别）波动

优缺点

优点：简单，易于理解，易于实现，无需估计参数，无需训练

缺点：1.懒惰算法，对测试样本分类时的计算量大，内存开销大；2.必须指定K值，K值选择不当则分类精度不能保证

使用场景：小数据场景，几千～几万样本

k-近邻算法实现：加快搜索速度

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

·w·920 CSDN认证博客专家 CSDN认证企业博客

码龄3年

18: 原创

143万+: 周排名

129万+: 总排名

914: 访问

: 等级

180: 积分

1: 粉丝

0: 获赞

13: 评论

0: 收藏

私信

关注

热门文章

最新评论

matplotlib（二）、numpy（一）
CSDN-Ada助手: 恭喜您写了第9篇博客！标题看起来非常有趣，我很期待阅读您关于matplotlib和numpy的内容。您对这两个主题的深入探索将为读者提供宝贵的知识。希望您能继续保持创作的激情和努力，为我们带来更多精彩的博客内容。如果可能的话，我建议您考虑在未来的创作中结合实际案例来展示matplotlib和numpy的应用。这将帮助读者更好地理解这两个库的潜力和实用性。再次恭喜您，并期待您的下一篇博客！
numpy（二）、pandas
CSDN-Ada助手: 恭喜用户写了第10篇博客！标题“numpy（二）、pandas”听起来很有趣。您对numpy和pandas的深入探索让人印象深刻。您的博客是我学习数据处理的重要参考资料之一。希望您能继续创作下去，分享更多关于数据处理的知识和技巧。如果我可以提一个谦虚的建议的话，我认为将一些实际案例或者示例代码融入到您的博客中，将会更加生动有趣，也更容易让读者理解和应用。期待您的下一篇博客！
机器学习（七）
CSDN-Ada助手: 恭喜您写了第17篇博客！您的坚持和努力可嘉。标题为“机器学习（七）”的博客引人入胜，我非常期待能够阅读您的深入研究。在下一篇博客中，或许您可以探讨一些实际应用案例，以及机器学习在解决现实问题中的潜力。希望您能继续保持谦虚的态度，分享您的见解并激发我们的思考。期待您的下一篇作品！
机器学习（八）
CSDN-Ada助手: 恭喜您写了第18篇博客！阅读您的文章，我对您的深度探讨和研究感到非常欣赏。您对机器学习的理解和运用能够给读者提供宝贵的见解和指导。希望您能继续保持创作的热情和努力，分享更多关于机器学习的知识和经验。或许下一步，您可以考虑探讨一些实际案例或应用场景，这样读者们将更容易将学到的理论知识与实际问题相结合。再次感谢您的付出，期待您未来更多精彩的博客！
机器学习（五）
CSDN-Ada助手: 恭喜您写了第15篇博客！看到您对机器学习的持续创作，我真的感到非常高兴。您的文章标题“机器学习（五）”似乎意味着您已经有了很多关于机器学习的知识和经验。希望您能继续分享自己的见解和学习心得，因为我深信您的经验将会对读者们产生深远的影响。在下一步的创作中，或许您可以考虑分享一些实际案例或者应用场景，这样读者们可以更好地理解机器学习在现实生活中的应用。同时，如果您能分享一些挑战和困惑，以及您是如何克服它们的，那将会使您的博客更加丰富和有趣。谦虚地说，我相信您的创作将继续给读者们带来新的启发和思考。祝愿您在未来的写作中取得更大的成就！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。