- 博客(261)
- 资源 (19)
- 问答 (2)
- 收藏
- 关注
原创 [Extensive Reading]background modeling:MOG2
MOG2背景建模方法发表于2004年,由Zoran Zivkovic提出,MOG2的改进过程大致是,单高斯背景建模,混合高斯背景建模,MOG到MOG2。
2021-12-21 17:53:07 1154
原创 梯度消失与梯度爆炸
简介梯度消失问题和梯度爆炸问题,总的来说可以称为梯度不稳定问题。ReLU激活函数,用Batch Normal,用残差结构解决梯度消失问题正则化来限制梯度爆炸梯度消失梯度消失的原始是反向传播时的链式法则。当模型的层数过多的时候,计算梯度的时候就会出现非常多的乘积项。用下面这个例子来理解:y1=w1x1+b1y_{1} = w_{1}x_{1} + b_{1}y1=w1x1+b1z1=σ(y1)z_{1} = \sigma(y_{1})z1=σ(y1)此时要更新参数b1b
2021-09-30 18:07:16 903
原创 Trajectory Forecasting:TrajNet++
概述由于自动驾驶和服务机器人等人工智能新兴应用的需求不断增长,拥挤场景中的轨迹预测已成为近年来的一个重要话题。轨迹预测的一项重要挑战是有效地建模社交互动。在过去的几年中,已经提出了几种新颖的方法。然而,这些方法已经在可用数据的不同子集上进行了评估,因此很难客观地比较结果。TrajNet++,是一个大规模的以交互为中心的基于轨迹的基准测试。不仅包含适当的轨迹采样数据,而且提供统一的广泛评估系统来测试收集的方法以进行公平比较。Referenceaicrowd trajnet challengeAwe
2021-09-28 20:40:25 1532
原创 transformer
transformer最早于2017年google机器翻译团队提出,也就是著名的《Attention Is All You Need》,transformer完全取代了以往的RNN和CNN结构,改为由transformer堆叠的方式构建模型。transformer在NLP领域首先取得了非常惊人的效果,随后DETR首次将transformer引入到了CV的目标检测任务重,随后VIT完全抛弃了CNN,改为完全由transformer实现基础的图像分类任务,之后transformer在CV领域的应用也变得一发
2021-09-28 15:43:10 3666
原创 深度学习中的激活函数总结
激活函数饱和问题一个激活函数h(n)h(n)h(n),当n趋近于正无穷,激活函数的导数趋近于0,称之为右饱和;当n趋近于负无穷,激活函数的导数趋近于0,称之为左饱和。当一个函数既满足左饱和又满足右饱和的时候我们称之为饱和。不满足上述两个条件的,称为不饱和激活函数。常见的激活函数,依照饱和或不饱和划分如下:饱和激活函数:sigmoidtanh不饱和激活函数:ReLULeaky ReLUPReLUSwishMish常用激活函数sigmoidg(z)=11+e−zg(z)
2021-09-24 15:13:08 416
原创 [Extensive Reading]目标检测(object detection)系列(十六)YOLOv4:平衡速度与精度
简介YOLOv4是YOLO之父Joseph Redmon宣布退出计算机视觉的研究之后推出的YOLO系列算法,其作者Alexey Bochkovskiy也参与了YOLO之前系列算法,《YOLOV4: Optimal Speed and Accuracy of Object Detection》,其主要贡献在于对近些年CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化,组合出一个精度与速度兼备的结构。...
2021-09-24 01:48:39 609
原创 SOT:dataset
https://github.com/jiajunhua/foolwood-benchmark_results/blob/master/img/recent_Tracker_development.pngDAVISDAVIS 2016DAVIS 2017ILSVRC VIDILSVRC 2015YouTube-BoundingBoxes
2021-09-14 17:16:34 417
原创 git token使用
2021年8月13日,git不再支持密码方式验证,而是建议使用token。token生成个人设置 > Settings > Personal access tokens > Generate new tokentoken使用clone新的项目时,拼接token和http链接:https://$GH_TOKEN@github.com/owner/repo.gitclone新的项目时使用http链接,密码换成token已经clone的项目,在.git/config中将原来的htt
2021-08-16 22:00:32 7785 1
原创 vscode跳转返回快捷键
windows系统:Alt+← … navigate backAlt+→ … navigate forwardMac系统:Ctrl± … navigate backCtrl+Shift± … navigate forwardOn Ubuntu Linux系统:Ctrl+Alt± … navigate backCtrl+Shift± … navigate forward
2021-08-12 11:44:38 8459
原创 python format
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。基本语法是通过 {} 和 : 来代替以前的 % 。format 函数可以接受不限个参数,位置可以不按顺序。
2021-08-08 16:51:19 224 1
原创 python dict setdefault()方法
描述Python 字典 setdefault() 函数和 get()方法 类似, 如果键不存在于字典中,将会添加键并将值设为默认值。
2021-08-04 10:52:47 375
原创 list和array 访问不连续index
python中内置数据类型list与numpy array都是常会用到的两种数据结构。二者在访问变量中不连续index时处理方式有所不同。
2021-08-03 21:28:52 682
原创 MOT:MOTchallenge任务评价方法
1,1,912,484,97,109,0,7,12,1,912,484,97,109,0,7,13,1,912,484,97,109,0,7,14,1,912,484,97,109,0,7,15,1,912,484,97,109,0,7,16,1,912,484,97,109,0,7,17,1,912,484,97,109,0,7,1index012345678value1191248497109071含义frame idtra
2021-07-28 21:03:46 772
原创 python pip
https://www.runoob.com/w3cnote/python-pip-install-usage.htmlDEPRECATION: Python 2.7 reached the end of its life on January 1st, 2020.
2021-07-26 17:11:36 189
原创 git pull 所有branch和tag并上传
git branch -r | grep -v ‘->’ | while read remote; do git branch --track “KaTeX parse error: Expected '}', got '#' at position 8: {remote#̲origin/}" "remote”; donegit fetch --allgit pull --all
2021-07-26 16:00:49 2331
原创 vscode 选择python解释器
当python环境不止一个时,vscode可以选择指定的python解释器,具体为:vscode设置中打开Command Palette键入 Python:Select Interpreter
2021-07-22 15:36:16 23834 1
原创 MOT:A Higher Order Metric for Evaluating Multi-object Tracking
简介:HOTA: A Higher Order Metric for Evaluating Multi-object Tracking是IJCV 2020的paper,在此之前以MOTChallenge为主的多目标跟踪benchmark一直采用以MOTA为排名的评价标准,但是MOTA有些情况下不足以衡量出多目标跟踪的性能,甚至都不如IDF1,所以这篇文章重新考量了多目标跟踪任务,并提出一种Higher Order Tracking Accuracy 的Metric。
2021-07-20 21:27:18 3256
原创 Objects Track Benchmarks
MOTMOT challengeTAOCaltech Roadside PedestriansBDD100KKITTInuScenesWaymoAOTPANDAArgoVerseSOTMOTSMOT challenge MOTSKITTI MOTSPoseTrackPoseTrackMTMCAICity challengeDuke-MTMCLIMA
2021-07-20 11:47:36 233
原创 ReID:常用损失函数总结
在ReID中常见的loss有Identity Loss、Verification Loss、Triplet loss。Deep Learning for Person Re-identification: A Survey and OutlookIdentity Loss将 Re-ID 的训练过程当成图像分类问题,同一个行人的不同图片当成一个类别,常见的有 Softmax 后加交叉熵损失函数Verification Loss将 Re-ID 的训练当成图像匹配问题,是否属于同一个行人来进行二分类
2021-07-15 22:02:37 2950
原创 [Extensive Reading]background modeling:ViBe
简介2009 年,Marc Van Droogenbroeck 等人提出了一种新的背景建模法: ViBe(Visual Background Extractor)算法。Vibe 是一种通用的运动目标检测算法,对于视频流类型、颜色空间、场景内容没有特定要求。ViBe: A universal background subtraction algorithmfor video sequences原理描述背景既然是背景建模,就必须解决一个问题,那就是怎么描述背景,ViBe将连续视频序列的背景定义为图像
2021-07-14 02:41:18 211
原创 MOT:多目标跟踪总结与思考
Task多目标跟踪(MOT)是一种常见的计算机视觉任务,任务要求检测到连续视频帧中的目标,并为每一个目标分配一个track id,这个id在视频序列中具有唯一性。多目标跟踪任务在带有时序性质的任务中扮演着重要的角色,因为它为检测的结果建立了时序上的关联,比如动作识别任务,比如车辆的movement判断等等,都需要以多目标跟踪为基础。所以多目标跟踪的任务性质决定:MOT需要和目标检测强关联,同时检测器的性能很大程度上影响了MOT的性能MOT是检测的下游任务,需要以检测器作为基础虽然现在MOT
2021-07-01 02:21:05 1427 3
原创 [Extensive Reading]SOT:SiameseRPN
简介SiameseFC成功使用孪生网络成功解决SOT问题,虽然它不是真正意义上的第一个使用Siamese结果的SOT算法,但是SiameseFC之于SOT,就像SORT之于MOT,RCNN之于目标检测,甚至AlexNet之于CNN一样。但是SiameseFC有一个致命的问题,无法适应尺度变化。就像最早的目标检测一样,当不是用SS做区域建议时,怎么解决目标尺度变化的问题:Faster R-CNN的RPN;SiameseRPN就是在SiameseFC的基础上引入PPN,处理SOT中的目标尺度变化;Sia
2021-07-01 01:40:40 178
原创 [Extensive Reading]SOT:SiameseFC
简介SiamFC:Fully-Convolutional Siamese NetworksSiamFC首次有效的将CNN应用到SOT任务,可以说SiamFC之于SOT,不亚于RCNN之于object detection;SiamFC之前的SOT任务一般使用简单模型在线训练,SiamFC的训练是离线的,所以效果和效率能很好的平衡;SiamFC是全卷积的结构,所以理论上可以接收任何尺寸的输入图像;SiamFC在VOT-15上当时达到SOTA,但是训练是在ILSVRC object detection
2021-06-30 02:32:06 265
原创 [Extensive Reading]MOT:CenterTrack
简介CenterTrack是CenterNet目标检测网络的作者xingyizhou在多目标跟踪领域的工作,《Tracking Objects as Points》,作为一个多目标跟踪算法,个人认为CenterTrack比较新颖的地方在于不完全依赖前后帧的IOU关系,而是把匹配的过程尽量多的交给CNN结果,减少了常规多目标跟踪方法中负责的匹配过程,而这个匹配甚至可以和IOU解耦,CenterTrack在单图训练的情况下,也有一定的跟踪能力。原理推理:输入:相比于一个检测模型,CenterTrack的
2021-06-30 00:58:08 476
原创 [Extensive Reading]目标检测(object detection)系列(十五) Mask R-CNN:检测与分割结合
简介Mask R-CNN 是在2017年提出,是FAIR团队的Kaiming大神和RBG大神的强强联手之作。paper的名字非常简洁,就叫Mask R-CNN,R-CNN系列确实可以独树一帜。Mask R-CNN无论是在方法创新上还是工程实现上,都非常具有影响力,首先是ICCV2017的best paper,其次FAIR团队的maskrcnn-benchmark项目也被很多人使用和改进,并作为其它工作的codebase model,现在,一方面由于maskrcnn-benchmark不再更新,以及det
2021-06-09 01:25:41 902
原创 [Extensive Reading]MOT:SiamMOT
简介SiamMOT是一个online的多目标跟踪(MOT)算法,《SiamMOT: Siamese Multi-Object Tracking》作者来自亚马逊,SiamMOT是ACM2020 Hieve竞赛行人多目标跟踪赛道的第一名,同时是ICCV2021 airmot竞赛的baseline。顾名思义,SiamMOT将SOT中siamese的思想引入MOT中,文中把这个过程叫做instance-level motion model。原理这种图可以比较清晰的呈现出SiamMOT的原理,首先ItI^t
2021-06-01 23:29:38 593
原创 MPII姿态估计性能评价标准-PCK
PCK是mpii使用的人体关键点估计评价标准,在coco之前,PCK一直是比较主流的metric,包括deepfashion,fashionAI等,都是使用的此标准。
2021-05-11 21:17:06 5906
原创 ReID:无监督及领域自适应的目标重识别概述
无监督(unsupervised)及领域自适应(domain adaptive)的目标重识别是目标重识别领域中两个重要的研究方向,同时二者又关系密切。本文中大部分配图和内容参考葛艺潇:无监督及领域自适应的目标重识别。
2021-05-10 21:49:04 3596
原创 coco姿态估计性能评价标准-AP
coco2017是当前最主流的多人姿态估计benchmark,官网的Evaluate已对coco的评价标准做了详细的解释,本文只对其二次整理。
2021-04-21 21:43:19 3959
原创 ReID:通用性能评价标准
简介Market-1501是行人重识别领域最为常用的benchmark,数据集在清华大学校园中采集,夏天拍摄,在 2015 年构建并公开。它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。训练集有 751 人,包含 12,936 张图像,平均每个人有 17.2 张训练数据;测试集有 750 人,包含 19,732 张图像,平均每个人有 26.3 张测试数据。3368 张查
2021-03-14 16:54:48 1216
原创 github镜像站
github常常会出现无法clone的情况,此时可以使用镜像站代替https://github.com.cnpmjs.orgorhttps://hub.fastgit.org比如:github中任意项目,选择http进行clonehttps://github.com/KevinQian97/ELECTRICITY-MTMC.git替换为https://github.com.cnpmjs.org/KevinQian97/ELECTRICITY-MTMC.git...
2021-03-01 11:28:24 6586
原创 [Intensive Reading]目标检测(object detection)系列(十四) FCOS:用图像分割处理目标检测
FCOS的paper是《FCOS: Fully Convolutional One-Stage Object Detection》,来自阿德莱德大学沈春华老师团队,作者是田植,其近期的工作时在实例分割方向非常惊艳的BoxInst。FCOS旨在利用全卷积的思路处理目标检测问题,它是一个anchor free的单阶段检测器,一个很有意思的地方是,FCOS和CenterNet都是在CornerNet之后,但是这它们几乎是同时挂到arxiv上,都在2019年的4月,且相差不到半个月。
2021-01-31 22:20:58 1718 1
原创 如何理解转置卷积(transposed convolution)
转置卷积也被称为反卷积,常被用用于CNN中的上采样操作,比如分割任务,或GAN网络中。反卷积并不是常规卷积的完全逆操作,反卷积也起不到根据输出特征以及对应的卷积核,恢复原始输出的作用,它最多的作用就是有可学习参数的上采样操作,仅此而已。同时,反卷积操作并没有把正向卷积输出,对应的卷积核拿过来做转置使用,而是多了几个卷积核而已。此外,即便是把正向卷积输出对应的卷积核拿过做反卷积,它也恢复不出来原来的参数,恢复原来参数这种操作看起来并没有太大意义,因为只是想做上采样而已。
2021-01-31 16:28:06 2978
原创 BN(Batch Normalization)层原理与作用
BN层最重要的作用是让加速网络的收敛速度,同时让网络训练变得更容易;另外调参过程也简单多了,对于初始化要求没那么高,而且可以使用大的学习率等,而没有使用BN的话,更大的学习率就可能导致训练发散,大学习率又反过来作用到训练速度上,加速了收敛速度,两者相辅相成。此外,也有一种说法是BN层可以提高网络的泛化能力,抑制过拟合,不过这个说法一直存在争议。
2021-01-20 01:54:41 45790
原创 Ubuntu 文件同步工具 rsync
cp和scp是ubuntu中文件拷贝常用的两个命令,一般在同一台服务器上我们是用cp命令,跨服务时使用过scp命令,但是如果做文件同步的话,rsync要比上述两个命令更好用一些,跨不跨服务器都是如此。因为rsync可以只同步需要更新的文件,而不是将所有的指定路径内的文件都拷贝一份,然后再目标路径下去覆盖源文件,比如本地的/mnt/tem文件夹要和远程xx.xx.xx.123的/mnt/tem路径做同步,可以使用:rsync -avu --progress /mnt/tem/ xx@xx.xx.xx.12
2020-08-02 17:54:58 1591
原创 Ubuntu nfs配置
NFS 即网络文件系统(Network File-System),可以通过网络让不同机器、不同系统之间可以实现文件共享。通过 NFS,可以访问远程共享目录,就像访问本地磁盘一样。NFS 只是一种文件系统,本身并没有传输功能,是基于 RPC(远程过程调用)协议实现的,采用 C/S 架构。ubuntu上的NFS用处非常广泛,比如可以让不同服务器上共享同一份文件,还可以增加服务的存储空间等等。既然是网络文件系统,nfs就必须要一个实际的物理空间作为服务端,而其他挂载这个空间的服务器称为客户端。nf服务端配置
2020-08-02 17:42:08 475
眼球跟踪定位算法,eyelike
2018-04-14
numpy-1.10.0
2017-05-13
matplotlib-1.3.0
2017-05-13
软件加密工具Zprotect
2017-03-22
《机器学习实战》源码
2017-02-13
《机器学习实战》源代码
2017-01-24
Halcon试用版生成C++代码
2017-04-03
软件设计中,加入动态模型的方法
2017-01-07
TA创建的收藏夹 TA关注的收藏夹
TA关注的人