- 博客(7)
- 收藏
- 关注
原创 第十八周周报
这片论文用的方法还是比较好的,用锚点去预测3D手姿势,比较新颖,与transformer结合,可以将这个模型加入到自己的模型中,可以考虑!A2J-Transformer的主要技术路线,主要包括三个主要的模块:金字塔特征提取器,锚点细化模型(包含特征增强模块和锚点交互模块)和锚点偏移权重估计模型。今天主要是画了模型的结构图和两个模块的结构图,写了transformer部分的内容。主要是写实验部分,写到了对比试验,其余还没写,实验还没完成。写论文的介绍和相关工作,相关工作部分已写完,介绍部分在写。
2023-06-10 19:41:25
133
原创 第十七周周报
自己的一点看法:上面的模型主要是得益于自己在原数据集中合成的模糊手的数据集,将其用于BlurHandNet,来适应论文中的模型,可以借鉴其思想。主要是做了transformer的前向过程修改,做了输入张量的维度修改,增加了一个维度,然后在结束的时候,重塑成原来的维度大小。并询问论文作者关于数据集准备的情况,作者告知在V1版本没有对数据集进行处理,按照readme进行就可以!修改代码,将下面的代码进行修改,可以看到最终的可视化效果,将False改为True。2023.06.02-06.03 周四-周五。
2023-06-04 20:00:33
130
1
原创 第十六周周报
今天联系了论文的作者,清楚了论文中使用的结果是在InterHand2.6mV0上进行训练的测试的,所以论文中的结果参考意义不是很大(当时写论文时还没有V1)。2、对self.gcn = SemGCN(adj, hid_dim=512, coords_dim=[3, 42], num_layers=4, nodes_group=None, p_dropout=None)中的hid_dim,coords_dim进行了修改,以匹配其前向过程的计算。,根据代码的实现,输入和输出的节点坐标维度应该是相同的。
2023-05-27 20:20:14
109
1
原创 第十五周周报
②人体姿势估计的代码用于手估计还是有很大的差别,所以不太好修改,另外,这两个模块的代码都是用于人体的源代码,只能根据源代码进行修改,用于手的参考论文中还没有释放这个代码,所以花费大量的时间。1、更改transformer的框架。处理代码的前向计算问题,因为使用的语义图卷积和transformer是用于人体姿势估计的,其中的维度大小和手姿势估计不匹配,要进行修改。①前向过程的计算,如张量维度进行矩阵乘法时维度不匹配的问题,需要仔细比较传进去的参数,看维度大小的变化。
2023-05-22 13:24:53
95
1
原创 第十四周周报
较⼩的值对应较少约束的w,⽽较⼤的值对w的约束更⼤。当输⼊为负时,ReLU函数的导数为0,⽽当输⼊为正时,ReLU函数的导数为1。给定训练数据特征X和对应的已知标签y,线性回归的⽬标是找到⼀组权重向量w和偏置b:当给定从X的同分布中取样的新样本特征时,这组权重向量和偏置能够使得新样本预测标签的误差尽可能⼩。然后,我们计算⼩批量的平均损失关于模型参数的导数(也可以称为梯度)。梯度下降最简单的⽤法是计算损失函数(数据集中所有样本的损失均值)关于模型参数的导数(在这⾥也可以称为梯度)。模型选择、⽋拟合和过拟合。
2023-05-15 21:21:42
73
1
原创 StyleSwin: Transformer-based GAN for High-resolution Image Generation论文和代码
StyleSwin模型框架是style-based generator上进行修改的,以SwinTransformer为基本框架,在看这篇论文之前,建议先看styleGAN、styleGAN2、SwinTransformer的论文,便于理解本论文中所提出的模型原理。该论文代码也是基于styleGAN2和SwinTransformer的代码进行修改的。
2022-10-19 20:56:39
1385
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人