人工智能AI 全栈体系(二)

第一章 神经网络是如何实现的

上节描述的网络结构比较特殊,不具有一般性。比如前面我们讲过的权重都是1或者-1,这是很特殊的情况,实际上权重可以是任何数值,可以是正的,也可以是负的,也可以是带小数的。权重的大小可以体现模式在不同位置的重要程度。比如,在笔画的中心位置,权重可能会比较大,而在边缘可能会比较小。这些权重也不是依靠手工设置的,而是通过样例学习到的。

那么神经网络是如何学习的呢?此节会先给出神经元和神经网络的一般性描述,然后下节会描述如何训练神经网络。

二、神经元与神经网络

  • 神经元和神经网络,指的是人工神经元和人工神经网络,为了简化起见,我们常常省略“人工”二字。

1. 神经元

请添加图片描述

  • 什么是神经元呢?图示的就是一个神经元,它有 x 1 {x_1} x1 x 2 {x_2} x2 x n {x_n} xn 共n个输入,每个输入对应一个权重 w 1 {w_1} w1 w 2 {w_2} w2、… 、 w n {w_n} wn,一个神经元还有一个偏置b,每个输入乘以对应的权重并求和,再加上偏置b,我们用net表示:
    n e t = w 1 ⋅ x 1 + w 2 ⋅ x 2 + ⋯ + w n ⋅ x n + b = b + ∑ i = 1 n w i ⋅ x i net = w_1 \cdot x_1 + w_2 \cdot x_2 + \cdots + w_n \cdot x_n + b = b + \sum_{i=1}^{n}{{w_i}\cdot{x_i}} net=w1x1+w2x2++wnxn+b=b+i=1nwixi
  • 对net再施加一个函数g,就得到了神经元的输出o:
    ο = g ( n e t ) \omicron = g(net) ο=g(net)
  • 这就是神经元的一般描述。为了更方便地描述神经元,我们引入 x 0 = 1 {x_0} = 1 x0=1,并令 w 0 = b {w_0} = b w0=b,则net也可以表示为:
    n e t = w 0 ⋅ x 0 + w 1 ⋅ x 1 + w 2 ⋅ x 2 + ⋯ + w n ⋅ x n = ∑ i = 0 n w i ⋅ x i net = w_0 \cdot x_0 + w_1 \cdot x_1 + w_2 \cdot x_2 + \cdots + w_n \cdot x_n = \sum_{i=0}^{n}{{w_i}\cdot{x_i}} net=w0x0+w1x1+w2x2++wnxn=i=0nwixi
    请添加图片描述

2. 神经元的向量表示

  • 为了表达简便,要引入向量的概念。
  • 可以把n个输入 x i {x_i} xi 用一个向量 x {x} x 表示: x = [ x 0 , x 1 , ⋯   , x n ] {x} = [x_0, x_1, \cdots, x_n] x=[x0,x1,,xn] ,同样,权重也可以表示为向量: w = [ w 0 , w 1 , ⋯   , w n ] {w} = [w_0, w_1, \cdots, w_n] w=[w0,w1,,wn] ,这样net就可以表示为两个向量的点积:
    n e t = w ⋅ x net = w \cdot x net=wx
  • 向量的点积,就是两个向量对应元素相乘再求和。而神经元的输出o就可以表达为:
    o = g ( n e t ) = g ( w ⋅ x ) o = g(net) = g(w \cdot x) o=g(net)=g(wx)
    请添加图片描述
  • g {g} g 表示什么呢?

3. 激活函数

  • 这里的 g g g 叫激活函数。上节讲的sigmoid函数就是一个激活函数。除了sigmoid函数外,激活函数还可以有其他的形式。以下是常用的几种。
3.1 符号函数

请添加图片描述

3.2 sigmoid函数

请添加图片描述

3.3 双曲正切函数

请添加图片描述

3.4 线性整流函数

请添加图片描述

3.5 softmax函数

请添加图片描述

4. 全连接网络

  • 多个神经元连接在一起,就组成了一个神经网络。
  • 在这个神经网络中,有一个输入层和一个输出层,中间有三个隐含层,每个连接都有一个权重。
  • 这个神经网络和上节讲的数字识别神经网络,工作原理是完全一样的。
  • 假定这是一个训练好的识别动物的神经网络,并假定第一个输出代表狗、第二个输出代表猫…,当输入一个动物图像时,如果第一个输出接近于1,而其他输出接近于0,则这个动物图像被识别为狗;如果第二个输出接近于1,其他输出接近于0,则这个动物被识别为猫。至于哪个输出代表什么,则是人为事先规定好的。这样的网络可以识别动物,也可以识别花草,也可以识别是哪个人。用什么数据做的训练,就可以做到识别什么,网络结构并没有什么大的变化。
    请添加图片描述
  • 相邻的神经元间都有连接,这种神经网络称为全连接神经网络。同时,在计算时,是从输入层一层一层向输出层计算,所以又称为前馈神经网络。

5. 总结

  • 一个神经元有n个输入,每个输入对应一个权重,输入与权重的加权和再经过一个激活函数后,得到神经元的输出。
  • 激活函数有很多种,常用的包括符号函数、sigmoid函数,双曲正切函数、线性整流函数等。
  • 前馈神经网络,又称全连接神经网络,其特点是连接只发生在相邻的两层神经元之间,并且前一层的神经元与下一层的神经元之间,两两均有连接,这也是全连接神经网络名称的来源。由于全连接神经网络均是由输入层开始,一层层向输出层方向连接,所有又称为前馈神经网络。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
AI大模型工程师是指在人工智能大模型领域具有面技术能力的工程师。他们不仅能够熟练掌握深度学习、机器学习等人工智能领域的核心算法和模型架构,还能够进行端到端的开发和实现,具备完整的技术堆知识。 首先,AI大模型工程师需要精通深度学习和机器学习的算法原理,包括神经网络、卷积神经网络、循环神经网络等各种模型结构和优化方法。他们需要能够灵活运用这些算法,解决各种复杂的人工智能问题。 其次,AI大模型工程师需要熟练掌握各种开发工具和框架,例如TensorFlow、PyTorch、Keras等,能够在这些框架下进行模型的实现和训练。 此外,AI大模型工程师还需要具备数据处理和分析的能力,能够处理海量的数据,并能够进行数据挖掘和特征工程,为模型训练提供高质量的数据。 最后,AI大模型工程师需要具备工程实现和部署的能力,能够将训练好的模型应用于实际的场景中,包括模型的优化和性能调优,以及模型的部署和服务化。 总之,AI大模型工程师需要具备面的人工智能技术能力,涵盖算法原理、开发工具、数据处理和工程实现等方面,能够独立完成从建模到部署的流程工作。这样的工程师在人工智能技术领域具有很高的竞争力,能够为企业和团队带来更多的价值和发展机会。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柠檬小帽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值