![](https://img-blog.csdnimg.cn/direct/ae70f1357c364e18bee661a063bf4c2f.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
《零基础学习TensorFlow》
文章平均质量分 81
很多粉丝反应不会深度学习框架,今天来一个。
码农三叔
这个作者很懒,什么都没留下…
展开
-
(16-2-02)智能客服系统:Android姿势预测器(2)
本项目的主Activity功能是由文件MainActivity.java实现的,功能是调用前面的布局文件tfe_sr_main_activity.xml,监听用户是否单击“发送”按钮。(2)文件SmartReplyClient.java:功能是将用户输入的文本做为输入,然后使用加载的模型实现预测处理。当用户在文本框输入文本并单击“发送”按钮后,会执行回复处理程序在屏幕上方显示智能回复信息。(1)文件AssetsUtil.java:功能是从资源目录“assets”加载模型文件,具体实现代码如下所示。原创 2024-07-07 11:00:11 · 360 阅读 · 0 评论 -
(16-2-01)智能客服系统:Android姿势预测器(1)
在上述代码中,调用了文件bottom_sheet_layout.xml中的布局信息,功能是在相机预览界面下方显示一个滑动面板,在面板中显示识别得分,还可以设置设备的类型和模型文件的类型。(1)打开app模块中的文件build.gradle,分别设置Android的编译版本和运行版本,设置需要使用的库文件,添加对TensorFlow Lite模型库的引用。在准备好TensorFlow Lite模型后,接下来将使用这个模型开发一个Android身体姿势识别器系统。原创 2024-07-06 15:33:07 · 248 阅读 · 0 评论 -
(16-1)智能客服系统:系统介绍+准备模型
本智能客服系统是基于智能回复模型实现的,能够基于用户输入的聊天消息生成回复建议。该建议是主要是依据上下文中的相关内容进行响应,帮助用户快速回复用户输入的文本消息。智能回复是上下文相关的一键式回复,可帮助用户高效、轻松地回复收到的短信(或电子邮件)。智能回复在包括Gmail、Inbox 和 Allo在内的多个 Google 产品中都非常成功。本项目的具体结构如图16-1所示。图16-1 项目结构。原创 2024-07-05 14:03:14 · 292 阅读 · 0 评论 -
(15-2-04)姿势预测器:Android姿势预测器(4)姿势识别
本项目的识别性能很大程度取决于我们的设备性能以及输出的幅度(热点图和偏移向量)。本项目对于不同尺寸的图片的预测结果是不变的,也就是说,在原始图像和缩小后图像中预测姿势位置是一样的。最终的输出幅度决定了缩小后的和输入的图片尺寸的相关程度,输出幅度同样影响到了图层的尺寸和输出的模型。更高的输出幅度决定了更小的网络和输出的图层分辨率,和更小的可信度。在本实例中,输出幅度可以为 8、16 或 32。更高的输出幅度速度更快,但是也会导致更低的可信度。在屏幕上方会显示摄像头的拍摄界面,在下方显示摄像头视频的识别结果。原创 2024-07-05 11:00:10 · 377 阅读 · 0 评论 -
(15-2-03)姿势预测器:Android姿势预测器(3)图像处理
提取摄像机中的图像,并使用线条绘制四肢和和头部器官,将回执结果保存到缓存中。具体实现代码如下所示。(2)编写文件MoveNet.kt实现移动处理,因为相机中的人物动作是动态的,所以需要适时绘制人物的四肢和头部器官的运动轨迹。编写函数torsoVisible()检查是否有足够的躯干关键点,此函数检查模型是否有把握预测指定裁剪区域中的一个肩部/髋部。将用摄像机预览图像时,会实时预测图像中人物的姿势,并通过图像处理技术绘制出人物的四肢。(3)编写文件PoseNet.kt实现姿势处理,具体实现代码如下所示。原创 2024-07-04 17:00:27 · 432 阅读 · 0 评论 -
(15-2-02)姿势预测器:Android姿势预测器(2)实现主Activity
本项目的主Activity功能是由文件MainActivity.kt实现的,功能是调用前面的布局文件activity_main.xml在屏幕上方显示一个相机预览界面,在屏幕下方的面板中显示识别结果的文字信息和控制按钮。(4)编写函数changeDevice(),功能是在应用程序运行时更改设备的类型。(2)定义图像侦听器,从预览的相机界面中加载排到的图像,实时监控图像的变化。(3)编写函数changeModel(),功能是在应用程序运行时更改模型。(1)定义需要的常量,设置实现相机预览功能的常量参数。原创 2024-07-04 14:33:11 · 397 阅读 · 0 评论 -
(15-2-01)姿势预测器:Android姿势预测器(1)UI布局
在上述代码中,调用了文件bottom_sheet_layout.xml中的布局信息,功能是在相机预览界面下方显示一个滑动面板,在面板中显示识别得分,还可以设置设备的类型和模型文件的类型。(1)打开app模块中的文件build.gradle,分别设置Android的编译版本和运行版本,设置需要使用的库文件,添加对TensorFlow Lite模型库的引用。在准备好TensorFlow Lite模型后,接下来将使用这个模型开发一个Android身体姿势识别器系统。原创 2024-07-04 11:22:49 · 132 阅读 · 0 评论 -
(15-1)综合实战:姿势预测器(1)系统介绍+准备模型
在本项目中,通过使用计算机图形技术来对图片和视频中的人进行检测和判断,如图片中的人露出了肘臂。本项目的具体结构如图15-1所示。图15-1 项目结构。原创 2024-07-03 17:50:19 · 92 阅读 · 0 评论 -
(14-3-02)TensorFlowTensorFlow.js智能前端实战:使用卷积神经网络进行手写数字识别(2)
验证准确率能够很好地预估模型对之前未出现过的数据的效果(只要该数据在某种程度上类似于验证集),但是我们可能需要更详细地了解不同类的性能。如果在使用训练数据时表现良好,但在使用验证数据时表现不佳,则意味着模型很可能与训练数据过拟合,并且对从未出现过的输入泛化效果不佳。,会在面板中显示一些报告训练进度的图表。此时在浏览器中运行文件index.html。(2)然后将如下代码添加到函数run(在浏览器中运行文件index.html。,会在面板中显示评估信息。的底部,功能是显示评估信息。对上述代码的具体说明如下。原创 2024-07-03 17:10:51 · 726 阅读 · 0 评论 -
(14-3-01)TensorFlowTensorFlow.js智能前端实战:使用卷积神经网络进行手写数字识别(1)
接下来将编写定义模型架构的代码,模型架构其实就是“模型在执行时会运行的函数”,或者“我们的模型将用于计算答案的算法”的另一种说法。//在卷积神经网络的第一层,我们必须指定输入形状,然后为在这一层发生的卷积运算指定一些参数。}));// MaxPooling层作为一种使用区域中的最大值而不是平均值的下采样.//重复另一个conv2d+maxPooling堆栈。// 注意,卷积中有更多的滤波器。}));// 将2D滤波器的输出展平成一维向量,准备输入最后一层。原创 2024-07-03 13:55:47 · 930 阅读 · 0 评论 -
(14-2)TensorFlowTensorFlow.js智能前端实战:保存和加载tf.Model模型
TensorFlow.js提供了保存和加载模型的功能,这些模型可以是使用LayersAPI创建的或从现有TensorFlow模型转换过来的。可能是我们自己训练过的模型,也可能是别人训练的模型。使用Layers API的一个主要好处是使用它创建的模型是可序列化的,这就是我们将在本节内容中探讨的内容。原创 2024-07-03 11:21:15 · 886 阅读 · 0 评论 -
(14-1)TensorFlowTensorFlow.js智能前端实战:Tensorflow.js简介
TensorFlow.js是一个开源的基于硬件加速的JavaScript库,用于训练和部署机器学习模型。原创 2024-07-02 20:42:38 · 836 阅读 · 0 评论 -
(13-4)TensorFlow Lite移动端与嵌入式轻量级开发实战:将元数据添加到 TensorFlow Lite 模型
TensorFlow Lite元数据为模型描述提供了标准,元数据是关于模型做什么及其输入/输出信息的重要信息来源。元数据由如下两者元素组成:在使用模型时传达最佳实践的可读部分代码生成器可以利用的机器可读部分,例如 TensorFlow Lite Android 代码生成器 和 Android Studio ML绑定功能。在TensorFlow Lite托管模型和TensorFlow Hub上发布的所有图像模型中,都已经被填充了元数据。原创 2024-07-02 14:19:48 · 963 阅读 · 0 评论 -
(13-3)TensorFlow Lite移动端与嵌入式轻量级开发实战:TensorFlow Lite转换器实战
通过使用TensorFlow Lite转换器,可以根据输入的TensorFlow模型生成TensorFlow Lite 模型。TensorFlow Lite 模型文件是一种优化的 FlatBuffer 格式,以“.tflite”为文件扩展名。原创 2024-07-02 11:10:47 · 784 阅读 · 0 评论 -
(13-2)TensorFlow Lite移动端与嵌入式轻量级开发实战:在Android中创建TensorFlow Lite
Android就是谷歌旗下的一款产品,跟计算机中的操作系统(例如Windows和Linux)类似。Android是一款智能设备操作系统的名字,可以运行在手机、平板电脑等设备中。原创 2024-07-01 21:17:30 · 757 阅读 · 0 评论 -
(13-1)TensorFlow Lite移动端与嵌入式轻量级开发实战:安装TensorFlow Lite解释器
的软件包是完整 TensorFlow 软件包的一小部分,其中只包含使用 TensorFlow Lite运行所需要的最少代码:仅包含Python类tf.lite.Interpreter。如果只想执行.tflite 模型,而不希望庞大的 TensorFlow 库占用磁盘空间,那么只安装这个小软件包是最理想的选择。要想使用Python快速运行TensorFlow Lite模型,需要先安装 TensorFlow Lite 解释器,而无需安装本书2。节中介绍的所有 TensorFlow软件包。原创 2024-07-01 21:14:45 · 230 阅读 · 0 评论 -
(12-3)TensorFlow无监督学习实战:视频嵌入系统
使用Keras OpenCV来初始预处理,然后使用 TensorFlow对某个视频进行无监督学习,在本实例中,将视频(.mp4 格式)转换为 256 列向量,这样就可以在广告推荐系统中进一步使用。)开始训练图片,设置训练超参数,创建编码模型,使用函数summary()打印输出概览信息。STM网络,设置训练超参数,创建编码模型,使用函数summary()打印输出概览信息。训练过程中缩小学习率,进而提升模型,在本实例中使用了。)在训练完毕后,使用imshow()(),最后保存训练的模型。PG格式或数组格式。原创 2024-06-27 21:00:00 · 521 阅读 · 0 评论 -
(12-2)TensorFlow无监督学习实战:训练商品评论模型
在本项目“Review-Generator”中,在“data”目录的记事本文件中保存了用户对商品的评论。)编写文件revgen.py,加载使用训练好的模型fake_review.hdf5分类处理用户的评论。使用TensorFlow中的Keras生成目标产品评论,以创建无监督的深度学习模型。将文本内容拆分为评论,并清除每一行的标点符号和大写字母,最后对每条评论换行处理。)编写文件createData.py处理“data”目录。原创 2024-06-27 17:15:00 · 167 阅读 · 0 评论 -
(12-1)TensorFlow无监督学习实战:无监督学习的基本概念
在现实生活中常常会有遇到下面的的问题:(1)缺乏足够的先验知识,因此难以人工标注类别;(2)进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们(部分)完成这些工作,或至少提供一些帮助。常见的应用背景包括:(1)一从庞大的样本集合中选出一些具有代表性的加以标注用于分类器的训练。(2)先将所有样本自动分为不同的类别,再由人类对这些类别进行标注。(3)在无类别信息情况下,寻找好的特征。在遇到上述问题时,人们很自然地希望计算机能代我们完成这些工作,或至少提供一些帮助。原创 2024-06-27 16:15:00 · 449 阅读 · 0 评论 -
(11-4)TensorFlow强化学习实战:自动驾驶程序
本项目是解决MountainCar-v0问题的升级版,在这个特定的控制理论问题中,汽车位于一维轨道上,位于两座“山”。唯一对汽车的干扰是以固定的动量向左或向右推动汽车,因此我们使用tf.agents在模型上实现强化学习,让汽车来回行驶自动向前到达山顶。本节的上一个手推购物车游戏程序,使用TF-Agents对项目进行了升级,升级为一个需要翻阅两座山的自动驾驶程序。TF-Agents是一个第三方库,提供了经过充分测试且可修改和扩展的模块化组件,可帮助开发者更轻松地设计、实现和测试新的 RL 算法。原创 2024-06-27 15:00:00 · 387 阅读 · 0 评论 -
(11-3)TensorFlow强化学习实战:推车子游戏
但是此时Q-Table有一个问题,用字典来表示Q-Table,State中的值是浮点数,是连续的,意味着有无数种状态,这样更新Q-Table的值是不可能实现。游戏的最终目标是爬到山顶,爬到山顶前的每一个动作都为最终的目标贡献了价值,因此每一个动作的价值计算,和最终的结果,也就是与未来(Future)有关。在Q-Table中,状态 next_s 有3个动作可选,即[0, 1, 2],对应价值 **Q[next_s][0],Q[next_s][1],Q[next_s][2]**。而上面这张表,就称之为。原创 2024-06-27 08:51:22 · 745 阅读 · 0 评论 -
(11-2-02)TensorFlow强化学习实战:Actor-Critic算法(2)
状态s:反映了环境的特征,在时间戳t上的状态记为St,它可以是原始的视觉图像、语音波形等信号,也可以是高层特征,如速度、位置等数据,所有的状态构成了状态空间S。动作a:智能体采取的行为,在时间戳t上的状态记为at,可以是向左、向右等离散动作,也可以是力度、位置等连续动作,所有的动作构成了动作空间A。奖励r(s,a):表达环境在状态s时接受a后给出的反馈信号,是一个标量值,一定程度上表达了动作的好与坏,在时间戳t上获得的激励记为rt。在训练完成后,建议可视化展示模型在环境中的表现。作为状态相关的基线,原创 2024-06-26 17:10:48 · 424 阅读 · 0 评论 -
(11-2-01)TensorFlow强化学习实战:Actor-Critic算法(1)
在传统的深度学习算法中,有两种十分常见的算法:基于价值Value的强化学习算法Deep Q Network和策略梯度(Policy Gradient)算法。基于值的强化学习算法基本思想是根据当前的状态,计算采取每个动作的价值,然后根据价值贪心的选择动作。如果我们省略中间的步骤,即直接根据当前的状态来选择动作。策略梯度(Policy Gradient)算法:基于值的强化学习算法的基本思想是根据当前的状态,计算采取每个动作的价值,然后根据价值贪心的选择动作。原创 2024-06-26 14:26:40 · 986 阅读 · 0 评论 -
(11-1)TensorFlow强化学习实战:强化学习的基本概念
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。在本章的内容中,将详细介绍使用TensorFlow实现强化学习开发的知识。强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。在本节的内容中,将简要介绍强化学习的几个概念。原创 2024-06-26 14:23:20 · 551 阅读 · 0 评论 -
(10-2-02)TensorFlow深度信念网络实战:深度信念网络应用实战:程序缺陷预测(2)
13)开始实现分类器(ANN)功能,使用outputX作为Classifier的输入。(14)最后查看结果15)实现混淆矩阵处理,(16)查看本方案的最终得分成绩,原创 2024-06-26 11:00:53 · 454 阅读 · 0 评论 -
(10-2-01)TensorFlow深度信念网络实战:深度信念网络应用实战:程序缺陷预测(1)
经过本章前面内容的学习,已经基本了解了深度信念网络的基础知识。在本节的内容中,将通过具体实例的实现过程,详细讲解在在TensorFlow中使用深度信念网络的方法。本实例的功能是,使用 DBN 模型分别进行ANN、LogisticRegression、GaussianNB 和 RandomForestClassifier 的训练和集成,用于在有缺陷的代码和干净的代码之间进行分类。本项目程程序保存在ipynb文件中,将在谷歌的Colaboratory中调试运行。原创 2024-06-25 21:12:41 · 758 阅读 · 0 评论 -
(10-1)TensorFlow深度信念网络实战:深度信念网络基础
深度信念网络(缩写为:DBN)由多个限制玻尔兹曼机(Restricted Boltzmann Machines)层组成,一个典型的网络结构如图1所示。这些网络被“限制”为一个可视层和一个隐层,层间存在连接,但层内的单元间不存在连接。隐层单元被训练去捕捉在可视层表现出来的高阶数据的相关性。原创 2024-06-25 14:10:43 · 447 阅读 · 0 评论 -
(9-3-02)TensorFlow概率图模型实战:概率图模型应用实战(2)
JointDistributionSequential是一个新引入的类似分布的类,它使用户能够快速构建贝叶斯模型的原型。联合分布的基本思想是让用户指定一个callable生成tfp.Distribution实例的s列表,一个对应于PGM 中的每个顶点。现在,让我们检查模型的最后一个节点/分布,可以看到现在正确解释了事件形状。当只有一个简单的模型时,这个分布类很有用。请注意,x保留为最后一个节点的名称,无法确定它是JointDistributionSequential 模型中的lambda参数。原创 2024-06-25 11:29:20 · 622 阅读 · 0 评论 -
(9-3-01)TensorFlow概率图模型实战:概率图模型应用实战(1)
经过本书签名的学习,已经初步了解了TensorFlow Probability概率模型的基本知识。在本节的内容中,将通过具体实实例来讲使用TensorFlow Probability开发实用程序的知识。原创 2024-06-24 13:57:06 · 781 阅读 · 0 评论 -
(9-2)TensorFlow概率图模型实战:TensorFlow Probability
TensorFlow Probability是TensorFlow提供的用于实现概率推理和统计分析的库。TensorFlow Probability是TensorFlow生态系统中的一部分,提供了概率方法与深度网络的集成、使用自动微分的基于梯度的推理,并能扩展到包含硬件加速 (GPU) 和分布式计算的大型数据集和大型模型。原创 2024-06-24 10:19:10 · 587 阅读 · 0 评论 -
(9-1)TensorFlow概率图模型实战:概率图模型表示
概率图模型是用图来表示变量概率依赖关系的理论,结合概率论与图论的知识,利用图来表示与模型有关的变量的联合概率分布。概率图模型理论分为概率图模型表示理论,概率图模型推理理论和概率图模型学习理论。近年来,概率图模型在人工智能、机器学习和计算机视觉等领域有广阔的应用前景。在本章的内容中,将详细介绍使用TensorFlow实现概率图模型开发的知识。概率图模型(PGM/probabilistic graphical model)是一种用于学习带有依赖(dependency)的模型的强大框架。原创 2024-06-23 21:12:04 · 741 阅读 · 0 评论 -
(8-2-04)TensorFlow注意力机制实战: Tensorflow机器翻译系统(4)
现在模型已经训练完毕,接下来需要执行完整的text => text翻译。本实例的模型需要通过所提供的映射output_text_processor反转text => token IDs,并且还需要知道特殊令牌的 ID。这都是在新类的构造函数中实现的。总的来说,这与训练循环相似,不同之处在于每个时间步的解码器输入是来自解码器最后预测的样本。文本到文本翻译循环,将结果收集到 python 列表中,然后tf.concat再将它们连接到张量中。在整个实现过程中,将静态地展开图形以进行max_length迭代。原创 2024-06-22 16:33:46 · 338 阅读 · 0 评论 -
(8-2-03)TensorFlow注意力机制实战: Tensorflow机器翻译系统(3)
虽然编写的自定义训练循环没有任何问题,但是在实现该Model.train_step()方法时,允许运行Model.fit并避免重写所有的样板代码。从一个模型类开始,整个训练过程将作为train_step该模型上的方法来实现。编写train_step()方法是对_train_step稍后将出现的实现的包装器。(5)编写方法_loop_step(),功能是执行解码器并计算增量损失和新的解码器状态 ( dec_state)(4)编写方法_train_step(),功能是处理除实际运行解码器之外的其余步骤。原创 2024-06-22 14:48:56 · 1054 阅读 · 0 评论 -
(8-2-02)TensorFlow注意力机制实战: Tensorflow机器翻译系统(2)
本实例中的解码器使用注意力机制来选择性地关注输入序列的一部分,将一系列向量作为每个示例的输入,并为每个示例返回一个“注意力”向量。为了使被导出的模型有用,这个模型应该接受tf.string类型的输入,并重新运行tf.string输出。本实例的标准化功能将被包裹在preprocessing.TextVectorization层中,该层将实现词汇提取和输入文本到标记序列的转换功能。下图7-5展示了该模型的概述,在每个时间段内,解码器的输出与编码输入的加权和相结合,以预测下一个单词。原创 2024-06-21 17:04:21 · 654 阅读 · 0 评论 -
(8-2-01)TensorFlow注意力机制实战: Tensorflow机器翻译系统(1)
实例8-1:Tensorflow使用注意力机制实现翻译系统(源码路径:daima\8\attention1.ipynb)我们将训练生成的模型导出为tf.saved_model,因为这样可以在其他 TensorFlow 环境中使用。在完成翻译工作的同时,需要生成对应的注意力图,在途中这显示输入句子的哪些部分在翻译时引起了模型的注意。如图7-3所示。图7-3 生成的注意力图编写形状检查器类ShapeChecker,如果文件类型不符合要求则进行修复,具体实现代码如下所示。# 对看到的每个轴名称进行缓存。原创 2024-06-21 14:21:13 · 133 阅读 · 0 评论 -
(8-1)TensorFlow注意力机制实战: 注意力机制基础
人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度(Acuity),只有视网膜中央凹部位具有最强的敏锐度。为了合理利用有限的视觉信息处理资源,人类需要选择视觉区域中的特定部分,然后集中关注它。例如,人们在阅读时,通常只有少量要被读取的词会被关注和处理。综上,注意力机制主要有两个方面:决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。注意力机制的一种非正式的说法是,神经注意力机制可以使得神经网络具备专注于其输入(或特征)子集的能力:选择特定的输入。原创 2024-06-21 14:17:27 · 843 阅读 · 0 评论 -
(7-3-03)TensorFlow自然语言处理实战:使用Seq2Seq模型实现机器翻译(3)
评估函数evaluate(sentence)类似于训练循环,每个时间步的解码器输入是其先前的预测、隐藏层状态和编码器输出。并调用注意力权重制图函数绘制翻译“hace mucho frio aqu”的翻译可视化图表,如图7-2所示。调用注意力权重制图函数绘制翻译“esta es mi vida.”的翻译可视化图表,如图7-3所示。图7-2 “hace mucho frio aqu”的翻译可视化图表。图7-3 “esta es mi vida.”的翻译可视化图表。原创 2024-06-20 14:17:12 · 309 阅读 · 0 评论 -
(7-3-02)TensorFlow自然语言处理实战:使用Seq2Seq模型实现机器翻译(2)
实现一个基于注意力的“编码器-解码器”模型,关于这种模型的基本知识,可以阅读 TensorFlow 的神经机器翻译 (序列到序列) 教程。本实例采用一组更新的API来实现,实现了上述序列到序列教程中的注意力方程式。下图中的和公式是 Luong 的论文中注意力机制的一个例子。输入经过编码器模型,编码器模型为我们提供形状为 (批大小,最大长度,隐藏层大小) 的编码器输出和形状为 (批大小,隐藏层大小) 的编码器隐藏层状态。图7-1 注意力机制。原创 2024-06-19 17:47:06 · 410 阅读 · 0 评论 -
(7-3-01)TensorFlow自然语言处理实战:使用Seq2Seq模型实现机器翻译(1)
请看下面的实例,功能是使用Seq2Seq模型将西班牙语翻译为英语。Seq2Seq是Sequence To Sequence的缩写,译为序列到序列。本实例的难度较高,需要对序列到序列模型的知识有一定了解。训练完本实例模型后,能够输入一个西班牙语句子,例如 "¿todavia estan en casa?",并返回其英语翻译结果"are you still at home?原创 2024-06-19 14:27:22 · 347 阅读 · 0 评论 -
(7-2-02)TensorFlow自然语言处理实战:RNN生成文本(2)
首先使用 tf.keras.Model.reset_states()函数初始化 RNN 状态,然后迭代数据集(逐批次)并计算每次迭代对应的预测。打开一个 tf.GradientTape 并计算该上下文时的预测和损失。使用 tf.GradientTape.grads()函数计算当前模型变量情况下的损失梯度。最后使用优化器的 tf.train.Optimizer.apply_gradients()函数向下迈出一步。# 训练步骤# 在每个训练周期开始时,初始化隐藏状态。原创 2024-06-18 14:19:19 · 901 阅读 · 0 评论