自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 资源 (1)
  • 收藏
  • 关注

原创 Transformer论文逻辑通俗解释

3.理解上述整体输入和输出逻辑之后,我们就可以对黑盒子里的结构进行进一步的剖析了,比如self-attention, cross-attention都是怎么做的,还有位置编码,训练时候的mask操作使得整个解码可以并行训练等等,这些在网上都有比较详细的解释,这里不再赘述。(1)举个最简单的例子,音频输入为“吃了吗”的一段音频(如果是机器翻译任务,可以是“Have you eaten”,反正是个序列),经过编码器,我们得到一个高维特征,记作Z。(5)这样就是整个编码-解码运行的逻辑了,包括输入和输出是啥。

2023-10-07 17:20:32 105

原创 牛顿法详解(海森矩阵如何使用)

看到一篇很好的文章,解释了牛顿法的原理

2022-06-23 16:27:13 342 1

原创 python opencv手动实现cv2.GaussianBlur

cv2.GaussianBlur()内部的计算逻辑

2022-06-23 16:25:20 1610

原创 关于Arcface loss的理解和代码

最近看了Arcface,建议先去看下原论文,然后结合博客和代码便于理解。记录一下比较好的博客:https://blog.csdn.net/qq_34914551/article/details/86515184https://blog.csdn.net/qq_40859461/article/details/86771136代码:(github上好像是有实验版本)https://blog.csdn.net/lmb09122508/article/details/90055316...

2022-03-07 11:40:10 861

原创 python最小二乘法拟合曲线

用到了最小二乘法拟合曲线,记录一下https://www.jb51.net/article/153711.htmhttps://zhuanlan.zhihu.com/p/72241280使用python读取excel文件数据:https://www.jb51.net/article/172932.htm

2022-01-29 17:15:53 2655

原创 pytorch和numpy实现标准差std结果不同

根据torch.std的文档页面,贝塞尔校正默认用于测量标准偏差。因此numpy.ndarray.std和torch.Tensor.std之间的默认行为是不同的。如果unbiased是True,将使用贝塞尔校正。否则,将计算样本偏差,不进行任何校正。为什么numpy和pytorch在均值和方差归一化后给出不同的结果?...

2021-11-22 11:15:37 1549

原创 使用numpy保存多维数组

1.np.savetxt可以直接保存一维数组,但无法保存多维2.np.savez(‘data’) 可以保存多维数组,很好用读取时用data = np.load(‘data.npz’)data.filesdata[‘arr_0’]即可。python numpy:保存N维数组(ndarray)到本地文件...

2021-11-17 20:01:05 3142

原创 解决vscode远程连接服务器循环登录输入密码的问题

看到一个很好的方法, 主要是由于异常退出导致的,所以要先关闭之前的服务:vscode 连接远程一直提示输入密码问题解决

2021-10-18 20:08:11 6177

原创 使用python-opencv, imgaug库进行数据增强

记录一些opencv数据增强方法亮度、饱和度、色相关于三者的介绍:https://blog.csdn.net/u011608180/article/details/86525766先将opencv读取的图片转为PIL格式:img = Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))然后使用torchvision进行增广:color_aug = torchvision.transforms.ColorJitter(brightness=0,

2021-10-12 14:49:58 1022

原创 ubuntu gem安装

想使用gem安装软件包,提示command not found “gem”,遂安装gem.sudo apt-get install rubygems参考:https://stackoverflow.com/questions/9485083/gem-command-not-found

2021-08-30 17:08:42 1336

原创 python+opencv目标检测图像平移、旋转、融合

1.平移随机获取平移点后直接平移图像即可。2.旋转先利用cv2.getRotationMatrix2D(获得仿射变化矩阵),再cv2.warpAffine(进行仿射变化),如:angle = np.random.randint(0, 90, 1)[0] # 随机获取旋转角度 0-90顺时针h, w = image.shape[0],image.shape[1]M = cv2.getRotationMatrix2D((w/2,h/2),angle,1)res = cv2.warpAffine(i

2021-08-19 17:33:21 886

原创 关于图像梯度、散度、泊松融合

在看泊松融合的时候复习了一下梯度、散度(大学学的全还给老师了……图像梯度计算图像中的梯度和散度看完上面两篇文章大致可以理解如何求梯度,为什么对梯度求偏导再相加的和为散度,然后可以看图像融合之泊松融合python 实现泊松融合:https://blog.csdn.net/aitail/article/details/106002129https://zhuanlan.zhihu.com/p/68349210...

2021-08-18 16:07:00 685

原创 ffmpeg的使用

用到了ffmpeg,记录一下。总的来说,使用ffmpeg截视频,抽帧比opencv快的多。按照视频的时间截取:commd = ‘ffmpeg -accurate_seek -i {path} -vcodec copy -ss {begin} -t {end} ./output4.mp4’.format(path=’./input.mp4’, begin=‘00:00:00’,end=‘00:00:02’)按照帧数截取视频:commd = ‘ffmpeg -i {path} -vf t

2021-08-17 12:07:59 491

原创 关于anchor box, RPN, ROIalign

记录一下看到的anchor box相关文章,写得不错:目标检测中的Anchor详解faster R-CNN中anchors 的生成过程(generate_anchors源码解析)

2021-08-12 14:37:10 222

原创 git将本地修改后的文件提交到远程

初始化版本库:git init添加文件到版本库(只是添加到缓存区),.代表添加文件夹下所有文件git add .把添加的文件提交到版本库,并填写提交备注(必不可少)git commit -m “update readme”把本地库与远程库关联(如果已经有origin关联则可以忽略)git remote add origin 你的远程库地址推送(提交)代码:git push <远程主机名> <本地分支名>:<远程分支名>如:git push ori.

2021-08-02 14:29:13 7792

原创 Cocoeval指定类别进行测试

看到一个好文章,记录一下如何使用COCO数据集api评估特定类别的AP其实质就是cocoEval.params.catIds = [1] # 1代表’person’类,你可以根据需要增减类别

2021-07-23 17:07:50 664

原创 pdb使用

用于终端模式下调试代码python 调试器之pdbimport pdb直接在代码里需要调试的地方放一个 pdb.set_trace() 就可以设置一个断点, 程序会在pdb.set_trace()暂停并进入pdb调试环境,可以用pdb 变量名查看变量,或者c继续运行...

2021-07-23 12:00:47 179

原创 关于mmdetection的一些记录

看到一些博客写的还行,记录一下MMDetection检测框架概述MMDetection中文文档—2.入门

2021-07-20 10:42:47 120

原创 Tmux配置与使用

记录一下Tmux 使用教程

2021-07-16 15:27:57 310

原创 LaTex使用的一些技巧记录

LaTex在处理表格、公式等格式上对新手不太友好,记录一下。先利用excel转latex绘制一个表格:https://www.tablesgenerator.com/latex_tables#设置表格宽度同页面文字宽度一致参考:https://blog.csdn.net/robert_chen1988/article/details/79505794?utm_source=blogxgwz4\begin{tabular*}{\hsize}{@{}@{\extracolsep{\fill}}

2021-06-18 11:08:03 562

原创 关于反卷积的理解

今天看到一个靠谱的解释,马一下。怎样通俗易懂地解释反卷积

2021-03-05 11:22:28 151

原创 图卷积入门及理解

记录一下最近看的图卷积的一些比较好的博客,适合入门理解。从全局观理解GCN,跳出复杂数学公式GCN (Graph Convolutional Network) 图卷积网络解析 (这篇其实没读,公式推导过程先跳过了,找到应用点再说)...

2020-12-02 15:46:45 290

原创 ECCV 2020 DETR:《End-to-End Object Detection with Transformers》

最近在学这篇文章方法,先记录一下看到比较好的博客,有机会再更。object queries : https://blog.csdn.net/u010734277/article/details/106502774Transformer: https://baijiahao.baidu.com/s?id=1651219987457222196&wfr=spider&for=pc...

2020-11-03 20:34:09 691

原创 深度学习中训练集正负样本数量不均衡问题

最近课题中遇到了这个问题,目标检测任务,anchor-free算法,一张特征图128*128,可能只有8个左右的正样本点,其他全是负样本点,训练起来效果很差。目前只是记录一下搜集到的解决方法,真正解决之后再来更新。Focal loss这应该是容易想到的方法。https://zhuanlan.zhihu.com/p/113716961https://www.cnblogs.com/areaChun/p/11900799.htmlhttps://blog.csdn.net/sinat_28454

2020-07-09 16:13:33 3215

原创 (Attention)注意力机制-入门与理解

首先推荐一篇入门博文,可以快速理解注意力机制的作用和本质。注意力机制的基本思想和实现原理(很详细)注意力机制的基本思想和实现原理(很详细)(第二篇)...

2020-03-19 11:24:41 824

原创 linux环境将python项目打包为docker镜像、上传到docker hub、拉取镜像、修改镜像并保存全过程

整整搞了大半天才完成这个事,主要网络太不稳定了……一、安装docker这个就不说了,根据操作系统版本自行安装。二、将python项目打包为docker镜像首先,python项目应整理在一个文件夹内。进入你运行python项目的虚拟环境,导出运行依赖的第三方库。(这一步也可以自己手写,总之要把得到的requirements.txt文件放入项目文件夹内,方便下一步操作。)pip free...

2020-03-17 00:47:23 2962

原创 机器学习中经常用到的一些方法

奇异值分解几乎从刚开始接触机器学习就听说了SVD,但是一直没有了解其原理。一文让你通俗理解奇异值分解

2020-02-23 17:06:33 296

原创 关于POM程序和Libpng使用中出现的一些问题

安装这篇文章写得很清楚,照着安装没啥问题。https://blog.csdn.net/weixin_38176039/article/details/82020865一些问题1.在运行POM的C语言版本程序时,需要先安装Libpng,运行安装程序出现下面报错。/usr/local/include/png.h:458:16: note: forward declaration of ‘pn...

2020-01-10 15:58:55 852

原创 相机参数(内参、外参)+对极几何(基本矩阵、本质矩阵)+三维重建相关

用到对极几何的知识,补充一些基础。相机模型参数:https://blog.csdn.net/Hee1234567890/article/details/80099878(这一篇足以)对极几何:https://blog.csdn.net/lancelot_vim/article/details/51724330https://www.cnblogs.com/jessica-jie/p/8085...

2019-11-14 22:44:49 2759 2

原创 《Online Multi-Target Tracking Using Recurrent Neural Networks》阅读笔记及理解

《Online Multi-Target Tracking Using Recurrent Neural Networks》2017 AAAI阿德莱德大学和ETH这篇文章是首次用RNN实现端到端的追踪。(2016年的AAAI是第一篇用RNN作追踪的文章,尽管效果很好,但是它用的是几乎完美的传感器数据,目标数目已知,且运动平滑、线性。)本文应该是目前网上能搜到这篇文章最全面的阅读笔记了,文末有...

2019-11-08 16:55:49 737

原创 RNN/LSTM记录

记录一些RNN/LSTM看过的不错的文章。LSTM结构详解循环神经网络(RNN)浅析

2019-11-07 21:26:37 286

原创 贝叶斯滤波、卡尔曼滤波

看了一会贝叶斯滤波,记录几篇看得明白的。https://www.cnblogs.com/FangLai-you/p/10973255.htmlhttps://www.cnblogs.com/ycwang16/p/5995702.html (这篇写得好)卡尔曼滤波:https://www.cnblogs.com/ycwang16/p/5999034.html马尔科夫链:https://b...

2019-11-07 21:23:28 625

原创 《JOINT MULTI-VIEW PEOPLE TRACKING AND POSE ESTIMATION FOR 3D SCENE RECONSTRUCTION》阅读笔记

有一段时间没更了,最近在忙着coding,没有好好作整理。往后会更新几篇论文阅读。《JOINT MULTI-VIEW PEOPLE TRACKING AND POSE ESTIMATION FOR 3D SCENE RECONSTRUCTION》是华盛顿大学唐正的文章,发表于2018年,讲的是一个离线的MOT方法。摘要:监视视频中数据分析的目的是充分理解和重建3D场景,即恢复每个对象的轨迹...

2019-11-04 22:04:57 436

原创 编码过程中的一些问题解决方法记录

1. UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x99 in position 10856: illegal multibyte sequence在安装sacred时出错,依照官网教程,pip install sacred,出现此错误。解决方法:找到报错所在的.py代码,一般是open文件的地方出错,将open的打开编码方式改为:en...

2019-10-18 22:35:30 2904 2

原创 YOLOv3的训练、测试、fine-tuning过程中遇到的问题

先占个坑。1.train时遇到错误:UserWarning: indexing with dtype torch.uint8 is now deprecated, please use a dtype torch.bool instead解决方法: https://blog.csdn.net/BBZZ2/article/details/101022935...

2019-10-08 17:11:13 1881

原创 使用基于Matlab的官方motchallenge-devkit评估工具进行多目标行人跟踪检测

最近在跑多目标跟踪的代码,研究了一下怎么对测试结果进行评估。踩了一下坑,下面是详细步骤。MOT数据集官网:https://motchallenge.net.测试用的数据集是MOT16、17.。MOT16、MOT17和MOT17 Det的训练集数据相同,MOT17 Det是针对行人检测的数据集,标签文件和前两个有所不同。数据集介绍:https://blog.csdn.net/u0124351...

2019-10-08 14:09:46 2712

原创 对YOLO-v3的理解及阅读笔记

YOLO-v3 阅读笔记YOLO-v3论文标题:《YOLOv3: An Incremental Improvement》。论文地址:https://pjreddie.com/media/files/papers/YOLOv3.pdf。项目官网:https://pjreddie.com/darknet/yolo/(当然GitHub上也有很多复现啦)YOLOv3的论文读起来很有趣,又短又好(?),...

2019-09-14 10:25:58 719

原创 对YOLO-v2的理解及阅读笔记

YOLO-v2 阅读笔记YOLO-v2论文标题:《YOLO9000:Better, Faster, Stronger》,CVPR2017的文章。论文地址:(懒得写链接了)。论文复现代码:http://pjreddie.com/yolo9000/这篇文章其中提出了两种模型,YOLOv2和YOLO9000.但是少了很多细节,比如损失函数的设计、先验框的匹配原则等,想要真正搞懂需要花不少力气看源码。...

2019-09-13 16:01:38 652

原创 对YOLO-v1的理解及阅读笔记

写在最前面开始写博客是想记录学习,也是鞭策自己。学习过程中发现网上许多博文不甚清楚,或者看过就忘,整理的过程增加了一些自己的理解,也算不小的收获。刚刚入门,难免出错,如有问题请不吝赐教,也欢迎讨论。最后,我想我至少会认认真真更新到毕业吧(大概YOLO-v1 阅读笔记YOLO-v1论文标题:《You Only Look Once: Unified, Real-Time Object Dete...

2019-09-11 20:59:20 416

motchallenge-devkit.zip

基于MATLAB的MOT官方评估工具,解压即可使用,亲测有效,童叟无欺。(我博客里也有使用步骤)

2019-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除