机器学习基础

最新推荐文章于 2024-07-17 21:40:42 发布

news_hhu

最新推荐文章于 2024-07-17 21:40:42 发布

阅读量79

点赞数

分类专栏：深度学习文章标签：机器学习人工智能 python

本文链接：https://blog.csdn.net/GoAIers/article/details/130421012

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

机器学习

基本概念

机器学习是指让计算机具有像人一样的学习和思考能力的技术的总称。具体来说是从已知数据中获得规律，并利用规律对未知数据进行预测的技术。

机器学习分类：

有监督学习(SupervisedLearning)：有老师(环境)的情况下，学生(计算机)从老师(环境)那里获得对错指示、最终答案的学习方法。跟学师评
无监督学习(UnsupervisedLearning)：没有老师(环境)的情况下，学生(计算机)自学的过程，一般使用一些既定标准进行评价。 自学标评
强化学习(Reinforcement Learning)：没有老师(环境)的情况下，学生(计算机)对问题答案进行自我评价的方法。自学自评

机器学习可以做如下两种分类

有监督学习：代表任务“分类”和“回归”
无监督学习：代表任务“聚类”和“降维”

数据集

数据集：观测样本的集合。

数据集分类

训练集(Trainingset)：用于模型拟合的数据样本；
验证集(Validation set)：是模型训练过程中单独留出的样本集，它可以用于调整模型的超参数和用于对模型的能力进行初步评估；
- 例如SVM中参数 $c$ (控制分类错误的惩罚程度)和核函数的选择，或者选择网络结构
测试集(Testset):用来评估模最终模型的泛化能力。但不能作为调参、选择特征等算法相关的选择的依据。

常见数据集

图像分类
- MNIST(手写数字) http://yann.lecun.com/exdb/mnist/
- CIFAR-10, CIFAR-100, ImageNet
  - https://www.cs.toronto.edu/~kriz/cifar.html
  - http://www.image-net.org/
电影评论情感分类
- Large Movie Review Dataset v1.0
  - http://ai.stanford.edu/~amaas/data/sentiment/
图像生成诗歌
- 数据集:https://github.com/researchmm/img2poem

误差分析

误差是指算法实际预测输出与样本真实输出之间的差异。

模型在训练集上的误差称为“训练误差”
模型在总体样本上的误差称为“泛化误差”
模型在测试集上的误差称为“测试误差”

由于我们无法知道总体样本会，所以我们只能尽量最小化训练误差，导致训练误差和泛化误差有可能存在明显差异。

过拟合是指模型能很好地拟合训练样本，而无法很好地拟合测试样本的现象，从而导致泛化性能下降。为防止“过拟合”，可以选择减少参数、降低模型复杂度、正则化等

欠拟合是指模型还没有很好地训练出数据的一般规律，模型拟合程度不高的现象。为防止“欠拟合”，可以选择调整参数、增加迭代深度、换用更加复杂的模型等。

泛化误差分析

假设数据集上需要预测的样本为Y，特征为X，潜在模型为 $Y = f (X) + ε$ ，其中 $\sim N(0,σ_ε)$ 是噪声, 估计的模型为 $\hat{f}(X)$ .
$\begin{array}{l}\operatorname{Err}(\hat{f})=\mathrm{E}\left[(Y-\hat{f}(\mathrm{X}))^{2}\right] \\ \operatorname{Err}(\hat{f})=\mathrm{E}\left[(f(X)+\varepsilon-\hat{f}(\mathrm{X}))^{2}\right] \\ \operatorname{Err}(\hat{f})=\mathrm{E}\left[(f(X)-\hat{f}(\mathrm{X}))^{2}+2 \varepsilon(f(X)-\hat{f}(\mathrm{X}))+\varepsilon^{2}\right] \\ \operatorname{Err}(\hat{f})=\mathrm{E}\left[(E(\hat{f}(\mathrm{X}))-f(X)+\hat{f}(\mathrm{X})-E(\hat{f}(\mathrm{X})))^{2}\right]+\sigma_{\varepsilon}^{2} \\ \operatorname{Err}(\hat{f})=\mathrm{E}[(E(\hat{f}(\mathrm{X}))-f(X))]^{2}+\mathrm{E}\left[(\hat{f}(\mathrm{X})-E(\hat{f}(\mathrm{X})))^{2}\right]+\sigma_{\varepsilon}^{2} \\ \operatorname{Err}(\hat{f})=\operatorname{Bias}^{2}(\hat{f})+\operatorname{Var}(\hat{f})+\sigma_{\varepsilon}^{2}\end{array}$
偏差(bias)反映了模型在样本上的期望输出与真实标记之间的差距，即模型本身的精准度，反映的是模型本身的拟合能力。