- 博客(9)
- 收藏
- 关注
原创 实时分割和物体追踪学习笔记:Fast Online Object Tracking and Segmentation: A Unifying Approach
1. 首先在第一帧指定对象的位置,用bbox给出。2. 用来追踪上一帧目标的是上一帧的窗口。除了可变大小和角度的bbox,还有一个固定大小的窗口。窗口可以认为是分割的最大可能的范围,总是包含要追踪的目标。尽可能让目标在窗口中心,然后对目标检测和分割。3. 检测到目标以后,得到目标的bbox,然后以该bbox中心为新的窗口中心。返回2,追踪下一帧。
2023-09-13 23:18:54 121
原创 Transformer前世今生(一)
待学习参数有网络参数,包括f的参数,g的参数,也包括a的参数。对a的学习,让网络自己学到(至少是我们希望网络自己学到)翻译出的单词的意思和原文的单词的意思的相关度。这篇论文为循环神经网络(RNN)引入了注意力机制,以提升长距离序列建模的能力,使得RNN可以更准确地翻译更长的句子,也是原始Transformer模型的开发动机。s是与输出状态有关的隐藏状态,而h只是输入的隐藏状态,与输出是什么没有关系。是输入相关的隐藏状态,也就是原文每个词的状态,和t之前时刻输入均有关;这是容易理解的,上下文的描述子。
2023-09-09 11:45:43 129 1
原创 3D关键点标注.smc文件读取
SMC (SenseMoCap)是一种文件格式,旨在支持多摄像头、多模型的数据。每个smc文件实际上是一个HDF5数据库,为跨平台、跨语言支持(如h5py、H5Cpp)提供了便利。但是每一个数据集可能都有自己的.smc文件格式,所需要的SMCReader也不相同。本文给出了自动将该文件解析为python的dict的代码。,它的标注格式是.smc文件。在github上查了一下,这个文件类型其实是.h5,所以用h5py读取即可。最近在研究3D关键点的数据集,发现了一个国产数据集。
2023-05-03 10:01:55 502
原创 FastICA的原理及实现
本文在研究了论文的基础上,结合其他大佬的分析,加上自己的理解,叙述原理并独立用python实现,和sklearn包中函数对比,能完成独立成分提取。
2022-09-07 20:46:22 6561 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人