Rrrrrr900-CSDN博客

原创文献阅读2_2_G2LTraj

根据Fig1显示，由于关键步骤都是同时生成，导致这些步长都缺乏相互约束，可能会导致运动学上的不可行预测。Fig1: (a)像Graph- TERN这样先进的模型没有办法很好地将未来步长之间的约束表示出来，导致运动学上的预测不可行。对于ETH和UCY的任务是基于观测到的8个步长（3.2秒），预测未来12个步长，即4.8秒。累积误差5和10分别是每个未来步骤于地面实值L2距离的平均值，分别超过5个和10个最有可能的预测值。nuScenes的任务是通过给定的4个步长和高清HD地图来预测未来的12个步长。

2024-05-21 16:24:08 613

原创文献阅读2_Transfer_LMR

1.video recognition：视频识别2.approach：适用于3.sub-par：低于标准4.underrepresented，rare：罕见的5.class distribution：分类分布6.modular：模块化7.training routine：训练程序8.extensively evaluate：广泛评估Transfer-LMR意义是：模块化训练程序，提高所有驾驶行为类别的识别功能。

2024-05-20 17:19:09 291

原创文献阅读1——G2LTraj

轨迹预测：trajectory prediction全局到本地：global to local生成：generation方法：approach交通代理商：traffic agent重要意义：substantial importance推断：infer递归方式：recursively同步方式：simultaneously约束：constraint运动学：kinematically不可行的：infeasible解决：address问题：issue提出：propose。

2024-05-16 16:26:33 889

原创深度学习实例4_fashion_mnist分类——自学笔记

损失函数（loss）：用于测量模型在训练期间的准确率。您会希望最小化此函数，以便将模型“引导”到正确的方向上。指标（metrics）：用于监控训练和测试步骤。以下示例使用了准确率，即被正确分类的图像的比率。优化器（optimizer）：决定模型如何根据其看到的数据和自身的损失函数进行更新。train_images&train_labels是训练集，模型用于学习。test_iamges&test_labels是测试集，用于测试。将像素的值标准化到[0,1]区间内。

2024-05-10 15:51:27 310

原创深度学习实例3_卷积神经网络Cifar10数据集分类——自学笔记

CIFAR10数据集是用来监督学习训练的，CIFAR10中有10类物体，标签值分别按照0~9来区分,他们分别是飞机（ airplane ）、汽车（ automobile ）、鸟（ bird ）、猫（ cat ）、鹿（ deer ）、狗（ dog ）、青蛙（ frog ）、马（ horse ）、船（ ship ）和卡车（ truck ）。这60000个样本被分成了50000个训练样本和10000个测试样本。官网下载链接：http://www.cs.toronto.edu/~kriz/cifar.html。

2024-05-09 16:59:00 568

原创深度学习实例2_车牌识别分割——自学笔记

【代码】深度学习实例2_车牌识别分割——自学笔记。

2024-05-09 15:36:14 433

原创深度学习实例1_mnist识别手写数字——自学笔记

2.然后通过一个卷积核为2×2的最大池化层，通道数不变，高宽变为一半，即维度变成（batch,10,12,12）；3.池化层：是一种非线性形式的下采样，主要用于特征降维，压缩数据和参数的数量，减小过拟合，同时提高模型的鲁棒性。再通过一个卷积核为2×2的最大池化层，通道数不变，高宽变为一半，即维度变成（batch,20,4,4）；3.然后再通过一个卷积核为5×5的卷积层，其通道数从10变为20，高宽分别为8像素；1.首先通过一个卷积核为5×5的卷积层，其通道数从1变为10，高宽分别为24像素；

2024-05-07 15:24:55 543

原创李沐72_深度学习优化算法——自学笔记

1.深度学习模型大部分是凸2.小批量随机梯度下降是最常用的优化算法3.冲量对梯度做平滑4.Adam对梯度做平滑，且对梯度各个维度值做重新调整。

2024-04-29 14:11:29 393

原创李沐70_bert微调——自学笔记

1.即使下游任务各有不同，使用BERT微调时君只需要增加输出层2.但根据任务的不同，输入的表示，和使用Bert特征也会不一样!pip install d2l==0.17.6 ### 很重要，不要下载错了，对于colab。

2024-04-28 16:33:38 1951

原创李沐69_BERT训练集——自学笔记

mlm的前向推断返回encoded_X的所有掩蔽位置mlm_positions处的预测结果mlm_Y_hat。我们将tokens定义为长度为8的2个输入序列，其中每个词元是词表的索引。下面的MaskLM类来预测BERT预训练的掩蔽语言模型任务中的掩蔽标记。get_tokens_and_segments将一个句子或两个句子作为输入，然后返回BERT输入序列的标记及其相应的片段索引。通过掩码下的预测词元mlm_Y的真实标签mlm_Y_hat，我们可以计算在BERT预训练中的遮蔽语言模型任务的交叉熵损失。

2024-04-26 16:12:01 1113

原创李沐68_Transformer架构——自学笔记

在下面的实现中，输入X的形状（批量大小，时间步数或序列长度，隐单元数或特征维度）将被一个两层的感知机转换成形状为（批量大小，时间步数，ffn_num_outputs）的输出张量。值得注意的是，解码器的自注意力权重和“编码器－解码器”的注意力权重都有相同的查询：即以序列开始词元（beginning-of-sequence,BOS）打头，再与后续输出的词元共同组成序列。与编码器的自注意力的情况类似，通过指定输入序列的有效长度，输出序列的查询不会与输入序列中填充位置的词元进行注意力计算。

2024-04-26 15:38:55 1035

原创李沐67_自注意力——自学笔记

中，行代表词元在序列中的位置，列代表位置编码的不同维度。从下面的例子中可以看到位置嵌入矩阵的第6列和第7列的频率高于第8列和第9列。第6列和第7列之间的偏移量（第8列和第9列相同）是由于正弦函数和余弦函数的交替。PositionalEncoding，为了使用序列的顺序信息，通过在输入表示中添加位置编码（positional encoding）来注入绝对的或相对的位置信息。二进制表示中，较高比特位的交替频率低于较低比特位，与下面的热图所示相似，只是位置编码通过使用三角函数在编码维度上降低频率。

2024-04-25 17:59:09 203

原创李沐66_使用注意力机制的seq2seq——自学笔记

1.seq2seq通过隐状态在编码器和解码器中传递信息2.注意力机制可以根据解码器RNN的输出来匹配到合适的编码器RNN的输出来更有效的传递信息。pip install d2l==0.17.6 ### 很重要，不要下载错了，对于colab。

2024-04-25 17:49:47 477

原创李沐67_自注意力——自学笔记

中，行代表词元在序列中的位置，列代表位置编码的不同维度。从下面的例子中可以看到位置嵌入矩阵的第6列和第7列的频率高于第8列和第9列。第6列和第7列之间的偏移量（第8列和第9列相同）是由于正弦函数和余弦函数的交替。PositionalEncoding，为了使用序列的顺序信息，通过在输入表示中添加位置编码（positional encoding）来注入绝对的或相对的位置信息。二进制表示中，较高比特位的交替频率低于较低比特位，与下面的热图所示相似，只是位置编码通过使用三角函数在编码维度上降低频率。

2024-04-25 17:42:24 577

原创李沐65_注意力分数——自学笔记

1.注意力分数是query和key的相似度，注意力权重是分数的softmax结果2.两种常见的分数计算:（1）将query和key合并起来进入一个单输出单隐藏层的MLP（2）直接将query和key做内积。

2024-04-24 18:01:30 550

原创李沐64_注意力机制——自学笔记

注意力机制中，通过query（随意线索）和key（不随意线索）来有偏向性的选择输入。

2024-04-24 17:09:01 379

原创李沐63_束搜索——自学笔记

4.束搜索在每次搜索时保存k个最好的候选：k=1时候是贪心算法，k=n时是穷举算法，一般k取5或者是10，但是越大实时性较差。3.时间复杂度O(knT)：k=5,n=10000,T=10,knT=5X10^5。1.在seq2seq中使用贪心搜索来预测序列：将当前时刻预测概率最大的词输出。2.在每个时刻，对每个候选新加一项（n种可能），在kn个选项中选出最好的k个。1.最优算法：对所有可能的序列，计算它的概率，选取最好的那个。2.如果输出字典大小为n，序列长度为T，需考察n。1.保存最好的k个候选。

2024-04-24 16:02:22 487

原创李沐62_序列到序列学习seq2seq——自学笔记

"英－法”数据集来训练这个机器翻译模型。

2024-04-23 17:10:20 1127

原创李沐61_编码器和解码器的架构——自学笔记

总而言之，“编码器-解码器”架构包含了一个编码器和一个解码器，并且还拥有可选的额外的参数。在前向传播中，编码器的输出用于生成编码状态，这个状态又被解码器作为其输入的一部分。在下面的解码器接口中，我们新增一个init_state函数，用于将编码器的输出（enc_outputs）转换为编码后的状态。在编码器接口中，我们只指定长度可变的序列作为编码器的输入X。编码器：将输入编程转换成中间表达形式（特征）解码器：将特征解码成输出。编码器：将文本表示成向量。解码器：向量表示成输出。

2024-04-23 16:04:12 205

原创李沐60_机器翻译数据集——自学笔记

假设同一个小批量中的每个序列都应该具有相同的长度num_steps，那么如果文本序列的词元数目少于num_steps时，我们将继续在其末尾添加特定的“”词元，直到其长度达到num_steps；此外，我们还记录了每个文本序列的长度，统计长度时排除了填充词元，在稍后将要介绍的一些模型会需要这个长度信息。除此之外，我们还指定了额外的特定词元，例如在小批量时用于将序列填充到相同长度的填充词元（“”），以及序列的开始词元（“”）和结束词元（“”）。让我们绘制每个文本序列所包含的词元数量的直方图。

2024-04-23 15:40:05 670

原创李沐58_深层循环神经网络——自学笔记

深度循环神经网络使用多个隐藏层来获得更多的非线性。

2024-04-23 15:16:37 337

原创李沐57_长短期记忆网络LSTM——自学笔记

初始化模型参数：超参数num_hiddens定义隐藏单元的数量。我们按照标准差0.01的高斯分布初始化权重，并将偏置项设为0。定义模型：长短期记忆网络的隐状态需要返回一个额外的记忆元，单元的值为0，形状为（批量大小，隐藏单元数）。训练和预测：引入的RNNModelScratch类来训练一个长短期记忆网络。实际模型的定义与我们前面讨论的一样：提供三个门和一个额外的记忆元。2.输入门：决定不是忽略掉输入数据。3.输出门：决定是不是使用隐状态。1.忘记门：将值朝着0减少。首先加载时光机器数据集。

2024-04-23 14:58:14 555

原创李沐56_门控循环单元——自学笔记

我们从标准差为0.01的高斯分布中提取权重，并将偏置项设为0，超参数num_hiddens定义隐藏单元的数量，实例化与更新门、重置门、候选隐状态和输出层相关的所有权重和偏置。训练结束后，我们分别打印输出训练集的困惑度，以及前缀“time traveler”和“traveler”的预测序列上的困惑度。此函数返回一个形状为（批量大小，隐藏单元个数）的张量，张量的值全部为零。准备定义门控循环单元模型，模型的架构与基本的循环神经网络单元是相同的，只是权重更新公式更为复杂。1.不是每个观察值都是同等重要。

2024-04-23 14:39:40 639

原创李沐55_循环神经网络RNN简洁实现——自学笔记

构造一个具有256个隐藏单元的单隐藏层的循环神经网络层rnn_layer。我们使用张量来初始化隐状态，它的形状是（隐藏层数，批量大小，隐藏单元数）。通过一个隐状态和一个输入，我们就可以用更新后的隐状态计算输出。需要强调的是，rnn_layer的“输出”（Y）不涉及输出层的计算：它是指每个时间步的隐状态，这些隐状态可以用作后续输出层的输入。一个完整的循环神经网络模型定义了一个RNNModel类。注意，rnn_layer只包含隐藏的循环层，我们还需要创建一个单独的输出层。"""循环神经网络模型"""

2024-04-19 16:57:15 441

原创李沐54_循环神经网络RNN——自学笔记

1.循环神经网络的输出取决于当下输入和前一时间的隐变量2.应用到语言模型中时，循环神经网络根据当前词预测下一次时刻词3.通常使用困惑度来衡量语言模型的好坏。

2024-04-19 16:54:18 365

原创李沐53_语言模型——自学笔记

在迭代过程中，除了对原始序列可以随机抽样外，我们还可以保证两个相邻的小批量中的子序列在原始序列上也是相邻的。这种策略在基于小批量的迭代过程中保留了拆分的子序列的顺序，因此称为顺序分区。基于相同的设置，通过顺序分区读取每个小批量的子序列的特征X和标签Y。通过将它们打印出来可以发现：迭代期间来自两个相邻的小批量中的子序列在原始序列中确实是相邻的。在这里，参数batch_size指定了每个小批量中子序列样本的数目，参数num_steps是每个子序列中预定义的时间步数。生成一个从0到34的序列。

2024-04-19 15:34:27 778

原创李沐52_文本预处理——自学笔记

解析文本的常见预处理步骤。这些步骤通常包括：1.将文本作为字符串加载到内存中。2.将字符串拆分为词元（如单词和字符）。3.建立一个词表，将拆分的词元映射到数字索引。4.将文本转换为数字索引序列，方便模型操作。

2024-04-19 15:32:48 416

原创李沐51_序列数据——自学笔记

使用一个相当简单的架构训练模型：一个拥有两个全连接层的多层感知机，ReLU激活函数和平方损失。基于k=1,4,16,64，通过对整个序列预测的计算，让我们更仔细地看一下k步预测的困难。生成一些数据：使用正弦函数和一些可加性噪声来生成序列数据，时间步为1-1000。必须使用我们自己的预测（而不是原始数据）来进行多步预测。让我们看看效果如何。3马尔可夫模型假设当前只跟最近少数数据相关，从而简化模型。1.时序模型中，当前数据跟之前观察到的数据相关。单步预测：检查模型预测下一个时间步的能力。

2024-04-18 17:08:56 370

原创李沐49_样式迁移——自学笔记

由于合成图像是风格迁移所需迭代的模型参数，我们只能在训练过程中通过调用extract_features函数来抽取合成图像的内容特征和风格特征。实验中，我们选择第四卷积块的最后一个卷积层作为内容层，选择每个卷积块的第一个卷积层作为风格层。由于我们还需要中间层的输出，因此这里我们逐层计算，并保留内容层和风格层的输出。使用VGG层抽取特征时，我们只需要用到从输入层到最靠近输出层的内容层或风格层之间的所有层。我们训练模型：首先将内容图像和风格图像的高和宽分别调整为300和450像素，用内容图像来初始化合成图像。

2024-04-18 15:22:44 672

空空如也

空空如也