机器学习-基础概念

Maslow503

于 2024-01-27 23:06:01 发布

阅读量333

点赞数 3

分类专栏：机器学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/myksecret/article/details/135889980

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

概念

机器学习是一门跨学科的学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究如何使用计算机模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构，并不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径。机器学习的研究目标是探索和开发一系列算法，使计算机能够通过数据来学习、建模，并利用建好的模型和新的输入来进行预测。

监督学习与非监督学习

监督学习与非监督学习是机器学习的两种基本方法，它们在处理数据和训练模型的方式上有明显的区别。

监督学习：
在监督学习中，模型通过已知输入和对应输出的训练数据来学习。这些训练数据带有明确的标签或结果，模型通过尝试匹配输入与标签来学习如何预测未知数据的标签。例如，在分类问题中，监督学习模型将新数据点映射到预定义的类别。监督学习的训练过程是找出一个函数（或模型），该函数能够根据输入数据预测输出结果。常见的监督学习算法包括线性回归、逻辑回归、决策树、支持向量机、神经网络等。
非监督学习：
非监督学习是另一种机器学习方法，它利用没有标签或目标输出的数据进行学习。在这种方法中，模型试图从原始数据中发现隐藏的模式或结构。非监督学习主要用于数据的聚类、降维和特征提取。常见的非监督学习算法包括K-均值聚类、层次聚类、PCA（主成分分析）等。

模型

机器学习中的模型是一种数学函数，它接受输入数据并生成预测结果。模型是通过对数据进行训练和学习得到的，能够反映输入数据与输出结果之间的内在关系和规律。

机器学习中的模型可以分为多种类型，如线性模型、决策树模型、集成模型、神经网络模型和支持向量机模型等。这些模型在处理不同类型的数据和问题时有各自的优势和适用场景。

模型的训练需要大量的数据，通过不断地优化模型参数和调整模型结构，可以提高模型的预测精度和泛化能力。训练好的模型可以用于新数据的预测和分类，帮助我们更好地理解数据的内在规律和做出正确的决策。

机器学习中的模型是一个重要的概念，它不仅是机器学习的核心，也是实现人工智能的关键之一。随着技术的不断发展，机器学习模型的应用场景将更加广泛和深入。

假设空间

假设空间是一个集合，包含了所有可能的函数形式。在机器学习中，假设空间通常由各种不同的模型构成，如线性回归模型、逻辑回归模型、决策树模型、支持向量机模型、神经网络模型等。这些模型都是为了拟合数据中的内在规律和模式，以便能够进行预测和分类等任务。

在机器学习的训练过程中，通常需要选择一个合适的假设空间，以便能够更好地拟合数据和解决问题。选择合适的假设空间需要考虑数据的性质、问题的特点以及模型的复杂度等因素。

过拟合

过拟合是指在模型训练过程中，模型对训练数据过度拟合，导致模型泛化能力差的现象。具体表现为，训练数据上表现很好，但在测试数据上表现较差。过拟合的原因主要有以下几点：

数据特征的角度：数据噪声导致过拟合。噪声具有一定的随机性与欺骗性，如果将噪声作为有效信息，会导致模型过分记住了噪声特征，而忽略了真实的输入输出间的关系。
模型的角度：模型复杂度过高，对训练数据拟合较好，但同时拟合了噪声或者与目标不相关的信息，导致泛化能力差。

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。