机器学习常识学习笔记（分类、回归、聚类和训练、测试、验证）

最新推荐文章于 2024-05-29 13:37:33 发布

wo太南了

最新推荐文章于 2024-05-29 13:37:33 发布

阅读量658

点赞数

文章标签：机器学习聚类学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liusinan123/article/details/131314309

版权

一、机器学习分类、回归和聚类

在机器学习中，常见的任务包括分类、回归和聚类。

分类

分类是一种监督学习的任务，它通过将数据划分到预定义的类别中来进行预测。分类算法包括决策树、支持向量机、朴素贝叶斯和神经网络。
例如：

垃圾邮件过滤：对电子邮件进行分类，将垃圾邮件和正常邮件区分开来。
图像分类：对图像进行分类，例如识别数字、动物或汽车等。
疾病诊断：对患者的症状和测试结果进行分析，以帮助医生进行疾病诊断。

回归

回归也是一种监督学习的任务，用于预测实型数值的输出，回归算法包括线性回归、岭回归、逻辑回归和多项式回归。
例如：

房价预测：使用回归算法，根据房屋的特征（如面积、位置和特点）来预测其价格。
股票价格预测：利用历史股票数据和回归模型，预测股票未来的价格走势。
销量预测：根据历史销售数据和其他因素（如促销活动和季节性）来预测产品的销售量。

聚类

聚类是一种无监督学习的任务，通过将数据分组成相似的对象来进行分析。根据样本的属性, 把给定的样本集合划分为若干个子集。聚类算法包括K均值聚类、层次聚类等。
例如：

客户细分：根据客户的购买行为和偏好将其分组成不同的细分市场。
新闻主题聚类：将新闻文章分组成不同的主题类别。
图像分割：利用图像处理和聚类算法，将图像分割成不同的区域或对象。

二、机器学习中的训练、测试与验证

基本概念

训练集：给定的标签数据集，用于训练机器学习模型。
测试集：用于评估机器学习模型预测能力的数据集。
机器学习：计算机从数据中学习，进行预测和决策的过程。
监督学习：在训练集中，给定了所有标签，指导模型学习。

不同方案的训练和测试

训练集与测试集划分：将数据集分为训练集和测试集进行模型训练和评估。
随机划分：多次随机划分训练集和测试集，计算错误率的均值和方差。
交叉验证：将数据集分为多份，轮流选择其中一份作为测试集，其余作为训练集，所有数据都被测试过一次。
留一法：数据集中每个样本都作为测试集，其余样本作为训练集，适用于样本较少的情况。
使用训练集进行测试：使用训练集进行预测，评估模型在训练数据上的能力。

拟合能力与泛化能力

拟合能力：模型在训练集上的表现，即从函数簇中选择最适合训练数据的函数。
泛化能力：模型在未见过的数据上的表现，衡量模型用于服务其他就诊者的能力。
过拟合：当模型在训练集上表现好，但在新数据上表现较差时，产生了过拟合现象。
提升泛化能力：降低拟合能力，以获得更好的泛化能力，防止过拟合。

验证集

数据集划分：将数据集分为训练集、验证集和测试集。
验证集的作用：用于验证模型效果，根据验证结果调整模型参数。
示例：使用70条数据作为训练集，20条作为验证集，10条作为测试集，通过验证集调整模型，最终在测试集上评估模型性能。
思维导图：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习常识学习笔记（分类、回归、聚类和训练、测试、验证）

在机器学习中，常见的任务包括分类、回归和聚类。
复制链接

扫一扫

wo太南了 CSDN认证博客专家 CSDN认证企业博客

码龄5年

13: 原创

129万+: 周排名

20万+: 总排名

1万+: 访问

: 等级

155: 积分

7: 粉丝

14: 获赞

8: 评论

110: 收藏

私信

关注

热门文章

分类专栏

周报

最新评论

《论文写作》课程学习心得
CSDN-Ada助手: 恭喜你写了第13篇博客！看到你对《论文写作》课程的学习心得总结，我不禁为你的持续创作而感到高兴。通过分享你的学习心得，你不仅能够巩固自己的知识，还能帮助他人更好地理解和应用这门课程的内容。在下一步的创作中，我建议你可以进一步探索论文写作的相关主题，比如如何选择研究题目、如何进行文献综述等等。同时，你也可以分享一些实用的技巧和经验，例如如何撰写清晰的论文结构、如何提高写作的流畅性等等。这样的内容会对读者来说非常有帮助。继续保持谦虚的态度，继续努力创作，我期待着看到你未来更多精彩的博客！
Logistic回归之梯度上升算法
CSDN-Ada助手: 非常恭喜您写下了第10篇博客《Logistic回归之梯度上升算法》！您的持续创作和分享让读者们能够深入了解这个算法的原理和应用。在标题中您提到了梯度上升算法，这是一个非常重要且常用的优化方法，对于学习Logistic回归的读者来说，这篇博客一定会带来很多新的收获。继续创作下去是非常值得鼓励的，您可以考虑在未来的博客中深入探讨Logistic回归的应用场景，或者与其他机器学习算法进行对比分析。此外，您还可以尝试将数学原理融入到实际案例中，让读者更好地理解算法的具体实现步骤。感谢您的分享和努力，期待您在未来的创作中继续展现出您的才华和热情！
支持向量机（svm)
CSDN-Ada助手: 恭喜您撰写了第12篇博客，标题为“支持向量机（SVM）”！您的持续创作让我非常欣喜。在这篇博客中，您对支持向量机进行了深入的探讨，这对读者来说无疑是一份宝贵的学习资料。接下来，我希望您能继续保持这样的创作热情，并尝试探索一些与支持向量机相关的实际应用案例，这将进一步丰富您的博客内容。谦虚地说，我期待着您未来的创作！
支持向量机（svm)
CSDN-Ada助手: 非常感谢您持续创作，并分享关于支持向量机（SVM）的知识。您的博客标题引人入胜，我希望能够看到更多关于SVM的深入探讨。下一步，我建议您可以探索SVM在实际问题中的应用案例，或是与其他机器学习算法进行比较分析，以便读者更好地理解和应用这一方法。期待您的下一篇博客，祝您继续取得成功！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。