自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

TTTree_的博客

原创 Transformer论文逻辑通俗解释

3.理解上述整体输入和输出逻辑之后，我们就可以对黑盒子里的结构进行进一步的剖析了，比如self-attention, cross-attention都是怎么做的，还有位置编码，训练时候的mask操作使得整个解码可以并行训练等等，这些在网上都有比较详细的解释，这里不再赘述。（1）举个最简单的例子，音频输入为“吃了吗”的一段音频（如果是机器翻译任务，可以是“Have you eaten”，反正是个序列），经过编码器，我们得到一个高维特征，记作Z。（5）这样就是整个编码-解码运行的逻辑了，包括输入和输出是啥。

2023-10-07 17:20:32 193

原创牛顿法详解(海森矩阵如何使用)

看到一篇很好的文章,解释了牛顿法的原理

2022-06-23 16:27:13 417

原创 python opencv手动实现cv2.GaussianBlur

cv2.GaussianBlur()内部的计算逻辑

2022-06-23 16:25:20 1748

原创关于Arcface loss的理解和代码

最近看了Arcface，建议先去看下原论文，然后结合博客和代码便于理解。记录一下比较好的博客：https://blog.csdn.net/qq_34914551/article/details/86515184https://blog.csdn.net/qq_40859461/article/details/86771136代码：（github上好像是有实验版本）https://blog.csdn.net/lmb09122508/article/details/90055316...

2022-03-07 11:40:10 954

原创 python最小二乘法拟合曲线

用到了最小二乘法拟合曲线，记录一下https://www.jb51.net/article/153711.htmhttps://zhuanlan.zhihu.com/p/72241280使用python读取excel文件数据：https://www.jb51.net/article/172932.htm

2022-01-29 17:15:53 2758

原创 pytorch和numpy实现标准差std结果不同

根据torch.std的文档页面，贝塞尔校正默认用于测量标准偏差。因此numpy.ndarray.std和torch.Tensor.std之间的默认行为是不同的。如果unbiased是True，将使用贝塞尔校正。否则，将计算样本偏差，不进行任何校正。为什么numpy和pytorch在均值和方差归一化后给出不同的结果？...

2021-11-22 11:15:37 1672

原创使用numpy保存多维数组

1.np.savetxt可以直接保存一维数组，但无法保存多维2.np.savez(‘data’) 可以保存多维数组，很好用读取时用data = np.load(‘data.npz’)data.filesdata[‘arr_0’]即可。python numpy：保存N维数组(ndarray)到本地文件...

2021-11-17 20:01:05 3276

原创解决vscode远程连接服务器循环登录输入密码的问题

看到一个很好的方法, 主要是由于异常退出导致的,所以要先关闭之前的服务:vscode 连接远程一直提示输入密码问题解决

2021-10-18 20:08:11 7049

原创使用python-opencv, imgaug库进行数据增强

记录一些opencv数据增强方法亮度、饱和度、色相关于三者的介绍：https://blog.csdn.net/u011608180/article/details/86525766先将opencv读取的图片转为PIL格式：img = Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))然后使用torchvision进行增广：color_aug = torchvision.transforms.ColorJitter(brightness=0,

2021-10-12 14:49:58 1091

原创 ubuntu gem安装

想使用gem安装软件包，提示command not found “gem”，遂安装gem.sudo apt-get install rubygems参考：https://stackoverflow.com/questions/9485083/gem-command-not-found

2021-08-30 17:08:42 1754

原创 python+opencv目标检测图像平移、旋转、融合

1.平移随机获取平移点后直接平移图像即可。2.旋转先利用cv2.getRotationMatrix2D(获得仿射变化矩阵)，再cv2.warpAffine(进行仿射变化)，如：angle = np.random.randint(0, 90, 1)[0] # 随机获取旋转角度 0-90顺时针h, w = image.shape[0],image.shape[1]M = cv2.getRotationMatrix2D((w/2,h/2),angle,1)res = cv2.warpAffine(i

2021-08-19 17:33:21 1019

原创关于图像梯度、散度、泊松融合

在看泊松融合的时候复习了一下梯度、散度（大学学的全还给老师了……图像梯度计算图像中的梯度和散度看完上面两篇文章大致可以理解如何求梯度，为什么对梯度求偏导再相加的和为散度，然后可以看图像融合之泊松融合python 实现泊松融合：https://blog.csdn.net/aitail/article/details/106002129https://zhuanlan.zhihu.com/p/68349210...

2021-08-18 16:07:00 783

原创 ffmpeg的使用

用到了ffmpeg，记录一下。总的来说，使用ffmpeg截视频，抽帧比opencv快的多。按照视频的时间截取：commd = ‘ffmpeg -accurate_seek -i {path} -vcodec copy -ss {begin} -t {end} ./output4.mp4’.format(path=’./input.mp4’, begin=‘00:00:00’,end=‘00:00:02’)按照帧数截取视频：commd = ‘ffmpeg -i {path} -vf t

2021-08-17 12:07:59 581

原创关于anchor box, RPN, ROIalign

记录一下看到的anchor box相关文章，写得不错：目标检测中的Anchor详解faster R-CNN中anchors 的生成过程（generate_anchors源码解析）

2021-08-12 14:37:10 287

原创 git将本地修改后的文件提交到远程

初始化版本库：git init添加文件到版本库（只是添加到缓存区），.代表添加文件夹下所有文件git add .把添加的文件提交到版本库，并填写提交备注(必不可少)git commit -m “update readme”把本地库与远程库关联（如果已经有origin关联则可以忽略）git remote add origin 你的远程库地址推送（提交）代码：git push <远程主机名> <本地分支名>:<远程分支名>如：git push ori.

2021-08-02 14:29:13 8237

原创 Cocoeval指定类别进行测试

看到一个好文章，记录一下如何使用COCO数据集api评估特定类别的AP其实质就是cocoEval.params.catIds = [1] # 1代表’person’类，你可以根据需要增减类别

2021-07-23 17:07:50 779

原创 pdb使用

用于终端模式下调试代码python 调试器之pdbimport pdb直接在代码里需要调试的地方放一个 pdb.set_trace() 就可以设置一个断点，程序会在pdb.set_trace()暂停并进入pdb调试环境，可以用pdb 变量名查看变量，或者c继续运行...

2021-07-23 12:00:47 241

原创关于mmdetection的一些记录

看到一些博客写的还行，记录一下MMDetection检测框架概述MMDetection中文文档—2.入门

2021-07-20 10:42:47 202

原创 Tmux配置与使用

记录一下Tmux 使用教程

2021-07-16 15:27:57 393

原创 LaTex使用的一些技巧记录

LaTex在处理表格、公式等格式上对新手不太友好，记录一下。先利用excel转latex绘制一个表格：https://www.tablesgenerator.com/latex_tables#设置表格宽度同页面文字宽度一致参考:https://blog.csdn.net/robert_chen1988/article/details/79505794?utm_source=blogxgwz4\begin{tabular*}{\hsize}{@{}@{\extracolsep{\fill}}

2021-06-18 11:08:03 684

原创关于反卷积的理解

今天看到一个靠谱的解释，马一下。怎样通俗易懂地解释反卷积

2021-03-05 11:22:28 213

原创图卷积入门及理解

记录一下最近看的图卷积的一些比较好的博客，适合入门理解。从全局观理解GCN，跳出复杂数学公式GCN (Graph Convolutional Network) 图卷积网络解析（这篇其实没读，公式推导过程先跳过了，找到应用点再说）...

2020-12-02 15:46:45 347

原创 ECCV 2020 DETR:《End-to-End Object Detection with Transformers》

最近在学这篇文章方法，先记录一下看到比较好的博客，有机会再更。object queries : https://blog.csdn.net/u010734277/article/details/106502774Transformer: https://baijiahao.baidu.com/s?id=1651219987457222196&wfr=spider&for=pc...

2020-11-03 20:34:09 741

原创深度学习中训练集正负样本数量不均衡问题

最近课题中遇到了这个问题，目标检测任务，anchor-free算法，一张特征图128*128，可能只有8个左右的正样本点，其他全是负样本点，训练起来效果很差。目前只是记录一下搜集到的解决方法，真正解决之后再来更新。Focal loss这应该是容易想到的方法。https://zhuanlan.zhihu.com/p/113716961https://www.cnblogs.com/areaChun/p/11900799.htmlhttps://blog.csdn.net/sinat_28454

2020-07-09 16:13:33 3442

原创（Attention）注意力机制-入门与理解

首先推荐一篇入门博文，可以快速理解注意力机制的作用和本质。注意力机制的基本思想和实现原理（很详细）注意力机制的基本思想和实现原理（很详细）(第二篇)...

2020-03-19 11:24:41 925

原创 linux环境将python项目打包为docker镜像、上传到docker hub、拉取镜像、修改镜像并保存全过程

整整搞了大半天才完成这个事，主要网络太不稳定了……一、安装docker这个就不说了，根据操作系统版本自行安装。二、将python项目打包为docker镜像首先，python项目应整理在一个文件夹内。进入你运行python项目的虚拟环境，导出运行依赖的第三方库。（这一步也可以自己手写，总之要把得到的requirements.txt文件放入项目文件夹内，方便下一步操作。）pip free...

2020-03-17 00:47:23 3207

原创机器学习中经常用到的一些方法

奇异值分解几乎从刚开始接触机器学习就听说了SVD，但是一直没有了解其原理。一文让你通俗理解奇异值分解

2020-02-23 17:06:33 335

原创关于POM程序和Libpng使用中出现的一些问题

安装这篇文章写得很清楚，照着安装没啥问题。https://blog.csdn.net/weixin_38176039/article/details/82020865一些问题1.在运行POM的C语言版本程序时，需要先安装Libpng，运行安装程序出现下面报错。/usr/local/include/png.h:458:16: note: forward declaration of ‘pn...

2020-01-10 15:58:55 950

原创相机参数（内参、外参）+对极几何（基本矩阵、本质矩阵）+三维重建相关

用到对极几何的知识，补充一些基础。相机模型参数：https://blog.csdn.net/Hee1234567890/article/details/80099878（这一篇足以）对极几何：https://blog.csdn.net/lancelot_vim/article/details/51724330https://www.cnblogs.com/jessica-jie/p/8085...

2019-11-14 22:44:49 2967 2

原创《Online Multi-Target Tracking Using Recurrent Neural Networks》阅读笔记及理解

《Online Multi-Target Tracking Using Recurrent Neural Networks》2017 AAAI阿德莱德大学和ETH这篇文章是首次用RNN实现端到端的追踪。（2016年的AAAI是第一篇用RNN作追踪的文章，尽管效果很好，但是它用的是几乎完美的传感器数据，目标数目已知，且运动平滑、线性。）本文应该是目前网上能搜到这篇文章最全面的阅读笔记了，文末有...

2019-11-08 16:55:49 819

原创 RNN/LSTM记录

记录一些RNN/LSTM看过的不错的文章。LSTM结构详解循环神经网络（RNN）浅析

2019-11-07 21:26:37 338 1

原创贝叶斯滤波、卡尔曼滤波

看了一会贝叶斯滤波，记录几篇看得明白的。https://www.cnblogs.com/FangLai-you/p/10973255.htmlhttps://www.cnblogs.com/ycwang16/p/5995702.html （这篇写得好）卡尔曼滤波：https://www.cnblogs.com/ycwang16/p/5999034.html马尔科夫链：https://b...

2019-11-07 21:23:28 696

原创《JOINT MULTI-VIEW PEOPLE TRACKING AND POSE ESTIMATION FOR 3D SCENE RECONSTRUCTION》阅读笔记

有一段时间没更了，最近在忙着coding，没有好好作整理。往后会更新几篇论文阅读。《JOINT MULTI-VIEW PEOPLE TRACKING AND POSE ESTIMATION FOR 3D SCENE RECONSTRUCTION》是华盛顿大学唐正的文章，发表于2018年，讲的是一个离线的MOT方法。摘要：监视视频中数据分析的目的是充分理解和重建3D场景，即恢复每个对象的轨迹...

2019-11-04 22:04:57 511

原创编码过程中的一些问题解决方法记录

1. UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x99 in position 10856: illegal multibyte sequence在安装sacred时出错，依照官网教程，pip install sacred，出现此错误。解决方法：找到报错所在的.py代码，一般是open文件的地方出错，将open的打开编码方式改为：en...

2019-10-18 22:35:30 3056 2

原创 YOLOv3的训练、测试、fine-tuning过程中遇到的问题

先占个坑。1.train时遇到错误：UserWarning: indexing with dtype torch.uint8 is now deprecated, please use a dtype torch.bool instead解决方法： https://blog.csdn.net/BBZZ2/article/details/101022935...

2019-10-08 17:11:13 1944

原创使用基于Matlab的官方motchallenge-devkit评估工具进行多目标行人跟踪检测

最近在跑多目标跟踪的代码，研究了一下怎么对测试结果进行评估。踩了一下坑，下面是详细步骤。MOT数据集官网：https://motchallenge.net.测试用的数据集是MOT16、17.。MOT16、MOT17和MOT17 Det的训练集数据相同，MOT17 Det是针对行人检测的数据集，标签文件和前两个有所不同。数据集介绍：https://blog.csdn.net/u0124351...

2019-10-08 14:09:46 2872

原创对YOLO-v3的理解及阅读笔记

YOLO-v3 阅读笔记YOLO-v3论文标题：《YOLOv3: An Incremental Improvement》。论文地址：https://pjreddie.com/media/files/papers/YOLOv3.pdf。项目官网：https://pjreddie.com/darknet/yolo/（当然GitHub上也有很多复现啦）YOLOv3的论文读起来很有趣，又短又好(?)，...

2019-09-14 10:25:58 793

原创对YOLO-v2的理解及阅读笔记

YOLO-v2 阅读笔记YOLO-v2论文标题：《YOLO9000:Better, Faster, Stronger》，CVPR2017的文章。论文地址：（懒得写链接了）。论文复现代码：http://pjreddie.com/yolo9000/这篇文章其中提出了两种模型，YOLOv2和YOLO9000.但是少了很多细节，比如损失函数的设计、先验框的匹配原则等，想要真正搞懂需要花不少力气看源码。...

2019-09-13 16:01:38 740

原创对YOLO-v1的理解及阅读笔记

写在最前面开始写博客是想记录学习，也是鞭策自己。学习过程中发现网上许多博文不甚清楚，或者看过就忘，整理的过程增加了一些自己的理解，也算不小的收获。刚刚入门，难免出错，如有问题请不吝赐教，也欢迎讨论。最后，我想我至少会认认真真更新到毕业吧（大概YOLO-v1 阅读笔记YOLO-v1论文标题：《You Only Look Once: Unified, Real-Time Object Dete...

2019-09-11 20:59:20 459

motchallenge-devkit.zip

基于MATLAB的MOT官方评估工具，解压即可使用，亲测有效，童叟无欺。（我博客里也有使用步骤）

2019-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄6年

39
原创

19
点赞

132
收藏

10
粉丝

关注

私信

热门文章

分类专栏

最新评论

RNN/LSTM记录
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。
编码过程中的一些问题解决方法记录
TTTree_: 哈哈哈能帮到你就好
编码过程中的一些问题解决方法记录
Call_me_Mr_P: 我靠，第二点你是怎么找到答案的啊哥，太感谢你了
相机参数（内参、外参）+对极几何（基本矩阵、本质矩阵）+三维重建相关
TTTree_: 你好，非常感谢你的指正！近期没在研究多视角，没时间深究了。我先把这段话注释掉，以防误导其他朋友，有时间再来讨论。再次感谢。
相机参数（内参、外参）+对极几何（基本矩阵、本质矩阵）+三维重建相关
我要燕麦: 博主你好，我看了你的解答又去看了MVG那本书，你的“3.A的求解”好像不太准确。论文中的A应该不是DLT法中的A。在MVG这本书的11.2线性三角形法中，那里的A和3.1DLT法中的A是不一样的，只是他们的思路差不多。博主你可以自己看一下。

提示

确定要删除当前文章？

取消删除