【工作周报】

Bohemian_mc

已于 2023-04-15 22:05:32 修改

阅读量155

点赞数

文章标签：深度学习 python 计算机视觉

于 2023-04-15 21:52:07 首次发布

本文链接：https://blog.csdn.net/zzPaulmn/article/details/130174816

版权

学习内容：

代码调试工作
观看了一些论文解读视频

学习时间：

4.10 ~ 4.15

学习笔记：

代码调试工作

深入分析了HMN和VPM代码后发现这两个模型的特征表示方式有一些区别：

HMN模型的特征表示方式是（batchsize，videosample_numb，feature_dim）。其中，batchsize表示输入数据的批次大小，videosample_numb表示每个视频被采样的帧数或者片段数，feature_dim表示每个帧或者片段的特征维度。每个视频都被划分成了多个帧或者片段，并且每个帧或者片段都提取出了相应的特征表示。
VPM特征表示方式是（batchsize，seq_len，feature_dim）。其中，batchsize表示输入数据的批次大小，seq_len表示每个输入序列的长度，feature_dim表示每个时间步上的特征维度。每个序列都是一段时间序列数据，每个时间步上都有相应的特征表示。
因此，这两种特征表示方式的区别在于处理的数据类型不同。第一个模型处理的是视频数据，第二个模型处理的是序列数据。

暂时还没有找到合适的解决思路能够实现这两种特征方式的转换，目前采取的方法是对HMN项目中的video_feature所对应的mask进行一些调整，使其能够对应上video_feature的第二个维度(videosample_numb=15)。

另外对于文本特征，也直接使用HMN中的numberic_caps(batchsize=64，max_cap_len=22)。

通过这样的调整解决了上次遇到的维度不匹配问题。

目前进展

强化学习模块大部分已经调试完成，还有最后几行代码有一些问题：

Traceback (most recent call last):
  File "/share/home/softrh02/.pycharm_helpers/pydev/pydevd.py", line 1496, in _exec
    pydev_imports.execfile(file, globals, locals)  # execute the script
  File "/share/home/softrh02/.pycharm_helpers/pydev/_pydev_imps/_pydev_execfile.py", line 18, in execfile
    exec(compile(contents+"\n", file, 'exec'), glob, loc)
  File "/share/home/softrh02/HMN/main.py", line 76, in <module>
    valid_loader, device, info, path_join)
  File "/share/home/softrh02/HMN/train.py", line 130, in train_fn
    greedy_sents = int2sent(greedy_ids[:, 1:].detach(), itos)
TypeError: python-BaseException
'function' object does not support item assignment

Bohemian_mc

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【工作周报】

这一工作的背后是大型语言模型 (Large Language Model，LLM) 生成领域的新训练范式：RLHF (Reinforcement Learning from Human Feedback) ，即以强化学习方式依据人类反馈优化语言模型，下面是一些。暂时还没有找到合适的解决思路能够实现这两种特征方式的转换，目前采取的方法是对HMN项目中的video_feature所对应的mask进行一些调整，使其能够对应上video_feature的第二个维度(videosample_numb=15)。
复制链接

扫一扫