TensorFlow入门知识

个人理解

TensorFlow是集齐了很多深度学习相关的算法的框架,你可以利用他搭建自己的神经网络模型。对于开发者来说,告诉TensorFlow一批特征数据和最终的答案数据,让其通过一个神经网络模型进行训练,最终输出模型。模型将应用于应用端,给他一个输入特征值,就能预测出一个答案。

神经网络模型的输入是一组特征,中间经过一段黑盒一层层的计算处理,输出一个预测值,整个模型的数据处理流程大概如图

在这里插入图片描述

概念

1、数据预处理

在很多特征数据中,数据会有不固定的数值,多个特征之间的值相差非常大,此时就需要对数据进行归一化,让数据等比缩小成为较小的浮点数。具体如图

在这里插入图片描述

2、模型层+激活函数

  • 模型层:是由神经元组成的基本组件,可以看作是网络的构建模块。模型层会设计一种算法,每个模型层接收一组输入并通过算法产生一组输出,这些输出通常作为下一层的输入
  • 激活函数:激活函数是依附在网络模型层的结尾,它类似于人脑中的“开关”,当神经元接收到输入时,激活函数会根据输入的大小是否达到了一定的阈值,决定是否打开开关

在这里插入图片描述

3、损失函数

  • 损失函数:是用来衡量模型预测结果与实际结果之间的差异,在训练模型过程中,我们会反复计算损失函数并对模型参数进行调整,直到损失函数达到最小值为止

可以把损失函数比作是一位老师,他会根据学生的答案与正确答案之间的差距来评价学生的表现。如果学生的答案与正确答案一致,那么损失函数会给予较低的评价,反之则会给予较高的评价。在机器学习中,我们希望通过最小化损失函数来让模型的预测结果更加接近实际结果,从而提高模型的准确性。

4、正则化惩罚项

  • 正则化惩罚项:是在损失函数中添加的一项约束值,用于约束模型的复杂度。它可以帮助我们避免过拟合的问题

可以把正则化惩罚项比作是一位教练,他会要求运动员在训练中不仅要达到一定的成绩,还要保持身体的健康和稳定。在机器学习中,我们希望模型在训练时不仅要在训练集上取得好的效果,还要在比赛数据中表现良好,并且不过度拟合训练集的噪声或异常点。

在这里插入图片描述

5、优化器

  • 优化器:是一种用于更新模型参数的算法。它的目标是通过最小化损失函数来训练模型,并使模型能够更好地拟合训练数据和泛化到新数据

可以把优化器比作是一位导游,他会带着我们找到一条最短的路径,使得我们可以更快地到达目的地。在机器学习中,优化器会根据损失函数的梯度信息来更新模型参数,从而使模型能够朝着更优的方向前进。

神经网络算法

1、卷积神经网络

  • 卷积神经网络:简称CNN,一种深度学习算法,它主要用于处理图像、语音和文本等数据。这种算法也是模型层的一层,期间会经过卷积->池化的过程,池化层通常与卷积层交替使用,构成卷积神经网络的基本结构。
  • 卷积操作:就是将一个小的矩阵(称为卷积核或过滤器)在输入数据上滑动,计算卷积核和输入数据对应位置的乘积,然后将所有乘积相加得到一个输出值。通过在不同位置应用不同的卷积核,CNN可以提取不同的特征,例如边缘、纹理、形状等。
  • 池化操作:用于减少特征图的尺寸和数量,从而降低模型的计算复杂度和内存占用,同时可以增加模型的鲁棒性和泛化能力。它的作用类似于压缩操作,将卷积后过大的尺寸进行压缩,可以减少模型的参数数量和过拟合的风险。

在这里插入图片描述

2、递归神经网络

  • 递归神经网络:简称RNN,一种深度学习算法,它主要用于处理序列数据,例如文本、语音、时间序列等。相比于传统的前馈神经网络,RNN在处理序列数据时具有更好的效果。RNN的特点是可以保存之前的状态,并将其作为下一个时间步的输入,形成一个循环的网络结构。这样可以对序列数据进行建模,捕捉到序列中的时序关系和长期依赖关系。
  • 优点:下一次计算会结合上一次的计算结果,相当于可以处理有序的数据。
  • 缺点:过多的前面的数据会导致计算越往后会把前面的值考虑进来,有点过长时间记忆的感觉。

在这里插入图片描述

3、长短时记忆网络

  • 长短时记忆网络:简称LSTM,它是一种特殊的递归神经网络,弥补了RNN的缺点,它可以在处理序列数据时更好地捕捉长期依赖关系,并防止梯度消失或爆炸等问题。LSTM的核心是增加一个遗忘参数C,在每一次递归中,它可以选择性地更新、保留或丢弃记忆单元中的信息。

在这里插入图片描述

文本概念

1、词向量

  • 词向量是一种表示词语的数学方式,它将每个词语映射到一个向量上,这个向量包含了该词语的语义信息。

2、CBOW

  • CBOW是一种浅层神经网络模型,它通常用于训练词向量。CBOW模型的输入是上下文中的多个词语,输出是当前词语出现的概率分布

在这里插入图片描述

3、Skip-gram模型

  • Skip-gram模型是一种基于神经网络的词向量训练算法,它通常用于生成高质量的词向量。Skip-gram模型的主要思想是通过当前词语来预测上下文中的其他词语。

在这里插入图片描述

开发环境搭建

  1. 安装Anaconda:https://www.anaconda.com/
  • Python全家桶,安装完成后,在开始菜单中找到Jupyter Notebook进行开发
  1. 安装TensorFlow
  • 通过开始菜单中找到Anaconda Prompt,并打开
  • 输入pip install tensorflow进行安装TensorFlow
  1. 打开Jupyter Notebook,新建NoteBook,输入代码并运行查看TensorFlow版本
import tensorflow as tf
import numpy as np

tf.__version__
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

许英俊潇洒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值