计算机视觉
文章平均质量分 55
zuber_ss
从菜鸟起步的程序猿。
展开
-
【算法学习】卡尔曼滤波
卡尔曼滤波笔记原创 2022-01-03 23:43:33 · 585 阅读 · 0 评论 -
Pytorch中遇到的一些问题
Q: RuntimeError: invalid argument 2: size ‘[-1 x 3 x 174]’ is invalid for input with 174 elements at /pytorch/torch/lib/TH/THStorage.c:37if self.reshape: base_out = base_out.view((-1, self....原创 2019-11-29 18:19:55 · 4305 阅读 · 6 评论 -
复用别人代码中遇到的问题(pytorch)
1.训练时loss保持一个“看似合理”的固定数值,test时准确率为0。原因:output和label维度不匹配或output或是label的值为02。原创 2019-11-06 17:11:57 · 655 阅读 · 0 评论 -
论文解析:Motion Guided Spatial Attention for Video Captioning
简介 这篇论文是复旦大学姜育刚教授团队发表在2019 AAAI上的一篇论文,这篇论文的主要思想是通过光流图“引导”空间上的注意力,从而实现视频字幕生成的任务。我个人认为这篇论文的思想较为新颖,合理,因此详细的阅读了这篇文章并再此做一个记录。1.论文思想 这篇论文中提到一个人类视觉注意力的一个“习惯”:...原创 2019-05-05 17:13:11 · 1120 阅读 · 0 评论 -
论文解读:Temporal Relational Reasoning in Videos
简介 这篇论文是MIT周博磊于2018年发表在ECCV上的一篇论文,这篇论文通过挖掘视频中多帧之间的时序关系来推理视频中的行为。我个人认为这篇论文从视频帧之间的关系入手,丰富了行为在时序上的依赖性,更符合目前的研究对于行为的理解。我将从以下几个方面讲解这篇论文,也是对自己阅读这篇论文的记录。论文思想 ...原创 2019-04-19 16:51:01 · 2186 阅读 · 2 评论 -
神经网络算法隐含层的选取
1.1 构造法首先运用三种确定隐含层层数的方法得到三个隐含层层数,找到最小值和最大值,然后从最小值开始逐个验证模型预测误差,直到达到最大值。最后选取模型误差最小的那个隐含层层数。该方法适用于双隐含层网络。1.2 删除法单隐含层网络非线性映射能力较弱,相同问题,为达到预定映射关系,隐层节点要多一些,以增加网络的可调参数,故适合运用删除法。1.3黄金分割法算法的主要思想:首先在[a,b]内寻...转载 2019-04-24 09:45:16 · 3526 阅读 · 0 评论 -
解析Im2Flow:Motion Hallucination from Static Images for Action Recognition
这篇论文是2018年cvpr的口头演讲论文,作者是德克萨斯大学奥斯汀分校的,这篇论文的思想主要是基于卡耐基梅隆大学的Dense Optical Flow Prediction from a Static Image的思想,但是采用的方法和结构都不太一样,总体来说,这篇论文的方法很有效,值得继续做下去。这篇论文主要从以下几点进行阐述: - 论文思想 - 论文贡献 - 实现细节 - 实验结构 ...原创 2018-09-10 16:43:54 · 1369 阅读 · 0 评论 -
Two_stream convolutional networks 代码复现过程中遇到的问题及解决办法
主要对2014年那篇基础论文:Two-stream convolutional networks for aciton recognition 进行代码复现,在这过程中遇到了不少的问题,在此记录一下,也希望能给别人提供一些帮助。 InvalidArgumentError (see above for traceback): indices[100] = [100,101] is out o...原创 2018-06-25 15:54:49 · 2566 阅读 · 12 评论 -
使用opencv逐帧计算光流
最近写了一小段代码关于计算视频中每一帧的光流,其中遇到了一个错误,查了一些相关资料,已经解决,在此记录一下。修改后代码def optical_flow(file_path): cap = cv2.VideoCapture(file_path) ret,frame1 = cap.read() prvs = cv2.cvtColor(frame1,cv2.COLOR...原创 2018-06-02 10:22:08 · 4286 阅读 · 6 评论 -
Two stream convolutional networks for action recognition in videos论文思想解析
原文地址在这里:https://www.cnblogs.com/jie-dcai/p/5745526.html 论文的三个贡献(1)提出了two-stream结构的CNN,由空间和时间两个维度的网络组成。(2)使用多帧的密集光流场作为训练输入,可以提取动作的信息。(3)利用了多任务训练的方法把两个数据集联合起来。Two stream结构 视屏可以分成空间与时间两个部分,空间...转载 2018-05-03 17:40:29 · 287 阅读 · 0 评论