机器学习基础个人笔记（五）

楠怪

已于 2022-04-03 23:14:43 修改

阅读量141

点赞数 1

分类专栏：深度学习文章标签：神经网络机器学习人工智能深度学习

于 2021-07-17 14:37:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43414292/article/details/118709250

版权

深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

前几节链接

机器学习个人笔记（一）_NanGuai的博客-CSDN博客

机器学习个人笔记（二）_NanGuai的博客-CSDN博客

机器学习个人笔记（三）_NanGuai的博客-CSDN博客

机器学习个人笔记（四）_NanGuai的博客-CSDN博客

目录

非线性假设

神经网络

非线性假设

下面是一个例子：

当我们用x1和x2进行预测时可以得到不错的效果，但是在实际当中，特征不仅仅只有几个。假设有100个特征，倘若用这100个特征来构建一个非线性模型，特征组合的数量将会十分惊人。而当特征太多的时候，无疑会增加计算机的工作量。与此同时，特征太多也会导致过拟合的发生。那么是否可以适当的减少一些特征呢？答案是否定的，如果减少特征，可能会导致模型拟合不出某些特定的情况。而这个时候则需要用到神经网络。

模型表示

首先来看一看人类大脑中的神经网络是怎样的。

上图是神经网络的基本单位神经元，注意它含有许多输入（树突），但只有一个输出（轴突）。而神经网络就是有大量的神经元互相连接构成的。

下面是一个神经元模拟逻辑单元的模型：

黄色圆圈就是一个类似神经元的东西，然后我们可以通过树突（x到黄圈之间的线）来传输一些信息，在神经元运算之后输出。有时候还会加入偏置单元x0，但是因为x0=1,所以需要根据具体情况再决定是否加入它。

接下来就是神经网络，第一层为输入层，第三层为输出层。中间的是隐藏层，因为在有监督训练中我们只能看到输入输出，并不知道中间的值，所以叫隐藏层。一般只要不是输入输出层，我们都可以称之为隐藏层。

那么神经网络具体是怎么运行的呢？

下面引入一些标记来描述模型：

$a_{i}^{(j)}$ 表示第j层的第i个激活单元，所谓激活单元指的就是一个神经元经过输入再输出的值。

$\theta^{(j)}$ 表示从第j层映射到第j+1层时的权重矩阵。图示如下：

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

楠怪 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。