NLP的基本概念1

最新推荐文章于 2024-08-26 21:26:51 发布

bolite

最新推荐文章于 2024-08-26 21:26:51 发布

阅读量448

点赞数 1

分类专栏： NLP 文章标签：自然语言处理机器学习人工智能

本文链接：https://blog.csdn.net/bolite/article/details/125669354

版权

NLP 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文介绍了机器学习的三种主要类型：监督学习、无监督学习和强化学习。监督学习依赖于已标注的训练数据来建立模型进行预测；无监督学习则在无标签数据中寻找模式；强化学习结合了监督和无监督的特点，通过与环境的交互学习最优策略。此外，文章还探讨了机器学习中的回归和分类任务，以及模型训练中的函数拟合、损失函数和优化方法，如梯度下降法。最后，提到了神经网络的构建以及深度对模型准确性的影响。

摘要由CSDN通过智能技术生成

注：此次笔记来自于《李宏毅2021/2022春机器学习课程》p1-p4的学习内容

强化学习，监督学习，无监督学习

监督学习

监督学习先由已标注正确的训练集进行训练，训练完成之后的“经验”称为模型，然后将未知的数据传入模型，机器即可通过“经验”推测出正确结果
在这里插入图片描述

无监督学习

无监督学习 本质上是一种统计手段(也可以理解为一种分类手段)，它没有明确目的的训练方式，你无法提前知道结果是什么，因此无须打标签。它的原理类似于监督学习中的回归，但在回归结果中没有打标签。
在这里插入图片描述

强化学习

强化学习指的是计算机对没有学习过的问题做出正确解答的泛化能力，可以理解为强化学习 =监督学习 + 无监督学习。和监督学习一样，它也是需要人工介入的。
在这里插入图片描述

机器学习的俩大任务

1.Regression（回归）就是找到一个函数 function，通过输入特征 x ，输出一个数值 Scalar 。

在这里插入图片描述

2.Classification（分类）就是让机器在人类已经设定好的选项里面选择一个当作输出的任务

在这里插入图片描述

寻找函数式

1.先假设函数试Y=b+wX1（X为训练数据中的输入，Y为X所对应的输出，b和w是未知的参数，式子是个猜测不一定是对的，后面数据训练后可进行修改）

2.定义Loss函数：L（b,w)参数为前面的b和w，Loss函数的输出表示将函数的b和w设定为该值时，所对应的准确率是好还是不好

Loss函数的求得方法：可以将x输入到特定的b和w求得预测的y，然后将预测的y和实际的y求相差的绝对值得到e，将全部的e相加去平均。
在这里插入图片描述

3.优化

在这里插入图片描述

优化方法——梯度下降法

在这里插入图片描述
我的理解是求Loss函数关于w的斜率，当斜率小于0的时候就w向前进，当斜率小于0的时候w就回退。不断的更新直到找到微分为0或者初始设定更新的次数达到为止。

其中，前进个回退的多少与他的微分和学习速率决定（红色landau表示的，hyperparameter为在实验中自己设定的值，这里的学习速率由我们自己设定）