深度学习
李同学的笔记
初晨的时光
展开
-
transformer结构解析--学习笔记
2.1掩码张量2.2注意力机制2.3多头注意力机制2.4前馈全连接层2.5规范化层2.6子层连接机构2.7编码器层2.8编码器3.解码器部分实现3.1解码器层3.2解码器4.输出部分实现5.模型构建6.模型基本测试运行文本嵌入层的作用无论是源文本嵌入还是目标文本嵌入,都是为了将文本词汇的数字表示转变为向量表示,希望在这样的高维空间表示词汇间的关系位置编码器的作用。...原创 2022-07-18 10:58:30 · 1324 阅读 · 1 评论 -
完整的模型训练套路(一)
数据训练模型步骤:1.准备数据集;2.利用Dataloader来加载数据集3.搭建神经网络(搭建神经网络可以单独设置一个.py文件,然后再引用)4.创建网络模型5.损失函数6.优化器优化7.设置训练网络的一些参数 记录训练的次数:total_train_step=0记录测试的次数;total_test_step=0训练的轮数:epoch=10代码如下:首先创建一个model.py文件,里面存放第3步骤自己所搭建的神经网络再创建一个train.py文件,(ps:里面记得引用model.p原创 2022-06-25 16:11:49 · 2070 阅读 · 0 评论 -
MNIST手写数字识别--案例
手把手教你实现mnist数字分类二,将数据由二维铺开成一维数据三,设置神经网络四,神经网络训练五,用训练好的模型进行预测,并在测试集上做出评价代码实现:原创 2022-06-13 23:35:25 · 323 阅读 · 0 评论 -
实现MINST图片的分类程序
实现步骤:1.导入库2.超参数设置3.载入MNIST数据4.设置训练配置5.搭建神经网络架构6.初始化架构7.定义损失函数和优化器8.训练9.测试ps:按照这样的框架结构方便我们理解 ,在代码中都备注的更加详细,代码实现如下:...原创 2022-06-08 13:24:40 · 358 阅读 · 0 评论