up~ up~-CSDN博客

原创第十八周周报

这片论文用的方法还是比较好的，用锚点去预测3D手姿势，比较新颖，与transformer结合，可以将这个模型加入到自己的模型中，可以考虑！A2J-Transformer的主要技术路线，主要包括三个主要的模块：金字塔特征提取器，锚点细化模型（包含特征增强模块和锚点交互模块）和锚点偏移权重估计模型。今天主要是画了模型的结构图和两个模块的结构图，写了transformer部分的内容。主要是写实验部分，写到了对比试验，其余还没写，实验还没完成。写论文的介绍和相关工作，相关工作部分已写完，介绍部分在写。

2023-06-10 19:41:25 133

原创第十七周周报

自己的一点看法：上面的模型主要是得益于自己在原数据集中合成的模糊手的数据集，将其用于BlurHandNet，来适应论文中的模型，可以借鉴其思想。主要是做了transformer的前向过程修改，做了输入张量的维度修改，增加了一个维度，然后在结束的时候，重塑成原来的维度大小。并询问论文作者关于数据集准备的情况，作者告知在V1版本没有对数据集进行处理，按照readme进行就可以！修改代码，将下面的代码进行修改，可以看到最终的可视化效果，将False改为True。2023.06.02-06.03 周四-周五。

2023-06-04 20:00:33 130 1

原创第十六周周报

今天联系了论文的作者，清楚了论文中使用的结果是在InterHand2.6mV0上进行训练的测试的，所以论文中的结果参考意义不是很大（当时写论文时还没有V1）。2、对self.gcn = SemGCN(adj, hid_dim=512, coords_dim=[3, 42], num_layers=4, nodes_group=None, p_dropout=None)中的hid_dim，coords_dim进行了修改，以匹配其前向过程的计算。，根据代码的实现，输入和输出的节点坐标维度应该是相同的。

2023-05-27 20:20:14 109 1

原创第十五周周报

②人体姿势估计的代码用于手估计还是有很大的差别，所以不太好修改，另外，这两个模块的代码都是用于人体的源代码，只能根据源代码进行修改，用于手的参考论文中还没有释放这个代码，所以花费大量的时间。1、更改transformer的框架。处理代码的前向计算问题，因为使用的语义图卷积和transformer是用于人体姿势估计的，其中的维度大小和手姿势估计不匹配，要进行修改。①前向过程的计算，如张量维度进行矩阵乘法时维度不匹配的问题，需要仔细比较传进去的参数，看维度大小的变化。

2023-05-22 13:24:53 95 1

原创第十四周周报

较⼩的值对应较少约束的w，⽽较⼤的值对w的约束更⼤。当输⼊为负时，ReLU函数的导数为0，⽽当输⼊为正时，ReLU函数的导数为1。给定训练数据特征X和对应的已知标签y，线性回归的⽬标是找到⼀组权重向量w和偏置b：当给定从X的同分布中取样的新样本特征时，这组权重向量和偏置能够使得新样本预测标签的误差尽可能⼩。然后，我们计算⼩批量的平均损失关于模型参数的导数（也可以称为梯度）。梯度下降最简单的⽤法是计算损失函数（数据集中所有样本的损失均值）关于模型参数的导数（在这⾥也可以称为梯度）。模型选择、⽋拟合和过拟合。

2023-05-15 21:21:42 73 1

原创第一次周报（2022.12.18~2022.12.25）

Diffusion Transformer

2022-12-26 20:13:18 44

原创 StyleSwin: Transformer-based GAN for High-resolution Image Generation论文和代码

StyleSwin模型框架是style-based generator上进行修改的，以SwinTransformer为基本框架，在看这篇论文之前，建议先看styleGAN、styleGAN2、SwinTransformer的论文，便于理解本论文中所提出的模型原理。该论文代码也是基于styleGAN2和SwinTransformer的代码进行修改的。

2022-10-19 20:56:39 1385 1

qq_44113082的博客