机器学习01-神经网络

Zhou1317fe5

已于 2023-07-20 14:12:18 修改

阅读量88

点赞数

分类专栏：机器学习文章标签：机器学习神经网络人工智能

于 2023-07-20 14:11:54 首次发布

本文链接：https://blog.csdn.net/j256904767/article/details/131829174

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

神经网路

什么是神经网络（Neural Networks）？最开始科学家想用算法去模拟大脑达到人工智能。通过一系列的实验发现，大脑是通过神经元进行工作的，神经元之间通过电信号传递信息。于是他们就开始模拟神经元的工作过程，用算法去模拟神经元，这就形成了神经网络。神经网络可以用来学习复杂的非线性假设模型。

为了构建神经网络模型，我们需要首先思考大脑中的神经网络是怎样的？

大脑中的神经元接受许多输入的信息，并进行一些计算和处理，计算后通过电脉冲发送给其他的神经元。上层神经元的输出又成为下层神经元的输入，下层神经元再次聚合来自其他神经元的输出作为该神经元的输入，然后将自己的输出发到其他神经元。这便是大脑中神经网络的工作原理。

请添加图片描述

我们将神经元简化如下：

请添加图片描述

每一个生物神经元都可以被认为是一个处理单元/神经核（processing unit/Nucleus），它含有许多输入/树突（input/Dendrite），并且有一个输出/轴突（output/Axon)。生物神经元会发送电脉冲，成为另一个神经元的输入。神经网络是大量神经元相互链接并通过电脉冲来交流的一个网络。

所有人工神经网络使用的是非常简化的生物神经元的数学模型。

我们用圆圈表示一个神经元，神经元所做的就是接受一个或多个输入，这些输入为数字，它进行一些计算后，输出一些数字，这些数字又作为下一层神经元的输入。我们构建人工神经网路时，通常同时模拟多个这样的神经元，而不是构建一个。
请添加图片描述

神经网络如何工作的？

案例一

我们用需求案例来了解神经网路时如何工作的，这个案例中目标是想知道那些短袖可能成为畅销品，以来规划更好的库存水平和营销活动。收集的数据有：不同短袖的价格，以及是否是畅销品。

请添加图片描述

在此示例中，输入特征X是短袖的价格，如果应用逻辑回归sigmoid函数来拟合这些数据，那么预测输出则为 $\frac1{1+e^{-(wx+b)}}$
请添加图片描述

在神经网络中，我们用a来表示算法的输出，a代表激活（activation），来源于神经科学的一个术语，指的是一个神经元向下游其他神经元发送多少高输出。

这个逻辑回归单元可看作大脑中单个神经元非常简化的数学模型。这个人工神经元所要做的就是，将价格X输入，然后利用sigmoid函数公式 $\frac1{1+e^{-(wx+b)}}$ 计算出输出值a，输出的则为这件短袖可能成为畅销品的概率。
请添加图片描述

鉴于对单个神经元的描述，构建神经网络只需要将这些神经元并在一起，并将他们连接起来。

案例二

接下来我们看一个更复杂的需求预测案例，在该案例中我们用四个特征来预测短袖是否为畅销品。四个特征为价格（price）、运费（shipping cost）、营销手段（marketing）、材料质量（material）。我们假设短袖是否能成为畅销品取决于以下几个因素：

affordability - 对这件短袖人们是否可负担的起?支付能力
awareness - 潜在买家对这件短袖的认识程度如何？短袖是否知名
perceived quality - 感知质量，人们是否有偏见或潜在偏见说这是一件高质量的短袖？

首先，我们要创建一个人工神经元来估计这件短袖被人们认为是可负担的起的概率。支付能力主要是价格和运费的函数，因为一件短袖的支付总额是价格加上运费。所以在这里我们使用一个神经元，一个逻辑回归单元来输入价格和运费，并预测人们是否负担的起。
请添加图片描述

接着，创建一个人工神经元来预测潜在买家对这件T恤衫的认识程度。短袖知名程度归因于营销手段。最后，要创建另一个神经元来估计人们是否认为这是高质量的短袖。这可能是短袖价格和材料质量的函数。
请添加图片描述

鉴于对可负担性（affordability）、认识程度（awareness）、感知质量（perceived quality）的预测，我们将这三个神经元的输出连接到右侧另一个神经元，然后该神经元输入这三个数字并输出可能成为畅销品的概率。
请添加图片描述

神经网络可看作逻辑回归，但是这个逻辑回归可以学习自身更好的特征，不需要手动设计，从而进行更准确的预测（神经网络=自动化特征工程+逻辑/线性回归)

在神经网络术语中我们把，我们将把这三个神经元组合在一起，形成谓的层（layer），层是一组神经元，它们将相同或相似的特征作为输入，然后一起输出一些数字，右边神经元也为层，所以层可以有一个或多个神经元。
请添加图片描述

右边这一层也叫做输出层（output layer），因为最后一层输出的是整个神经网络的预测值。最左边输入的四个特征也叫输入层（input layer)。在输入层和输出层中间的所有层都叫隐藏层，在神经网络中输入层和输出层都有明确的数值，而中间的层并没有告诉确切的数值，是未知的。

我们还将 affordability、awareness、perceived quality 叫做激活（activations）。激活源于生物神经元，它指的是生物神经元向下游其他神经元发送的高输出值或发送许多电脉冲的程度。这些关于affordability、awareness和perceived quality的数字是该层中这三个神经元的激活。同样输出概率是右侧这个神经元的激活。
请添加图片描述

至此，我们手动选择了那个神经元需要那几个特征作为输入，但神经网络在实践中层中的每一个神经元都可以访问上一层的每一个特征，从输入层访问每个值。
请添加图片描述
你可以想象，如果试图预测短袖的可负担性，并且它知道价格、运费、营销和材料，你可能会忽略营销和材料，只注重于价格和运费。我们就可以通过适当地设置参数来找出那些特征与负担能力最相关，比如价格和运费权重较大，而营销和材料的权重较小。

Zhou1317fe5

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习01-神经网络

要创建另一个神经元来估计人们是否认为这是高质量的短袖。这可能是短袖价格和材料质量的函数。鉴于对可负担性（affordability）、认识程度（awareness）、感知质量（perceived quality）的预测，我们将这三个神经元的输出连接到右侧另一个神经元，然后该神经元输入这三个数字并输出可能成为畅销品的概率。
复制链接

扫一扫

专栏目录