ckqsars-CSDN博客

原创 transformer中的attention机制之旅

本文为学习笔记，若有相关交流或者需要补充的评论区欢迎attention在深度学习之中最初是作为模型中的一个组件用于提升模型精度，其原理是为了通过一定的计算方式获取信息中强化关注的特征。本文主要介绍在近几年attention相关的衍生。

2024-10-11 14:09:37 1042

github地址paddleocr优化项:SVTR_LCNetV3：精度更高的骨干网络Lite-Neck：精简的Neck结构GTC-NRTR：稳定的Attention指导分支Multi-Scale：多尺度训练策略DF: 数据挖掘方案DKD ：DKD蒸馏策略SVTR_LCNetV3SVTRScene Text Recognition with a Single Visual ModelSVTR主要思想是:提出local mix block 和 global mix block 把局部特征

2024-03-19 16:38:52 1875

原创文字检测--Progressive Scale Expansion Network(PSENet)解读

论文解读笔记：文章链接：PSENetcode:https://github.com/whai362/PSENet对于对目标检测不了解同学可以先了解目标检测。本文重点记录文字检测中存在的问题已经PSENet中解决的方法。先上网络结构做个简单的拆分，左边是常见的目标检测结构，通过neck把特征进行融合。右边是采用n组的分割网路采用不同的分割scale其中S1最小，Sn最大，命名为progressive Scale Expansion前面的BACKBONE和FPN是常见用法，就不进行介绍，主要记录

2022-03-21 14:54:02 1394

原创多目标跟踪评价指标及其计算方式

基于MOT的benchmark记录相关的评价指标以及其计算方式和意义MOTA ( Multiple Object Tracking Accuracy)MOTA计算所有帧的匹配情况，t为帧数，FN为False Negative，FP为False Positive，IDSW为ID Switch，GT为Ground Truth 物体的数量，计算所有帧的漏检数和误检数以及ID发生变化的情况。上述公式可以拆解成三块∑tFNt∑tGTt\frac{\sum_t{FN_t}}{\sum_t{GT_t}}∑t

2022-02-18 08:45:08 5510

原创 One-stage Detection YOLO 与 SSD对比

作为在one-stage Detection领域中，存在两类领军级别的检测器，大部分的one-stage的检测器都或多或少能看到这两者的影子，这两个就是YOLO()和SSD

2021-12-08 20:00:30 6269

原创 PyQt5 ubuntu18.04 使用小技巧

！！！在安装好pyqt5发现没法使用的时候，先尝试安装openGL，可以直接安装在本机使用apt 安装opengl如下sudo apt-get install build-essential libgl1-mesa-devsudo apt-get install freeglut3-devsudo apt-get install libglew-dev libsdl2-dev libsdl2-image-dev libglm-dev libfreetype6-dev使用pip安装如下 pip

2021-04-22 10:53:38 229

原创 License Plate Recognition的基础介绍，以及LPRNet的解读

License Plate Recognition(车牌识别)基本介绍车牌识别，目标是准确识别图片中所拍到的车牌的信息，现在在各大停车场已经很常见了。在车牌识别中，比较大的挑战就在于拍摄角度的不同、距离的差异、光线的差异、包括雨雾天气等的影响会导致抓取的照片或帧的清晰度很差。车牌的识别整体主要分为两部分，车牌的检测和牌照的识别在本文中，主要介绍牌照识别。牌照识别牌照识别，其实可以看做OCR(Optical Character Recognition)文字识别中的一个小类，它相比文字识别而言，简单的

2020-09-13 21:24:29 5137

原创人群计数方法简介

这里写自定义目录标题主要记录近几年基于Deep learning的密集人群计数的相关方法主流方法基于detection的人群计数方法基于主要记录近几年基于Deep learning的密集人群计数的相关方法主流方法基于detection的人群计数方法主要通过对行人的detection，然后统计detection的个数。使用范围：在行人较少时，且图像中行人较明显时。效果较好限制：无论是anchor base的还是anchor free的检测器，都存在检测最小目标的下限，当图片中目标较小时，基于检测器

2020-07-09 19:04:17 2730 4

原创 FariMot(A Simple Baseline for Multi-Object Tracking)多目标跟踪器解读

本文只是记录笔者关于这篇论文的解读，并不是文章翻译，所以想看关于introduction或者related的可以去直接看文章或者其他的笔记。论文地址代码地址简述FairMot是一个把检测和跟踪结合在一起的模型，模型的输出同时有检测信息以及re-id的信息，根据re-id的feature的信息把前后帧检测出的目标进行关联起来。网络结构网络结构如图所示，输出的同时用detection和re-id部分，其中网络的backbone采用的DLA-34，在检测方面采用的是anchor-free的检测思路，

2020-05-13 17:53:52 1259

原创 pytorch小tips

查看pytorch的环境python -m torch.utils.collect_env

2020-04-15 11:29:37 245

原创 EfficientDet解读

对于近期屠榜的EfficientDet，记录相关的笔记，也欢迎大家交流先附上原文连接：EfficientDet原文在提及EfficientDet时，首先要提一下EfficientDet的backbone，EfficientNet。EfficientNet原文在EfficientNet中，提及一个比较主要一个思路就是：复合缩放众所周知：对于一个baseline网络，调整其深度、宽度、输入分...

2020-04-14 15:15:01 5529 2

原创 ATSS论文解读

ATSS论文解读链接文章创新点详细解读合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入链接论文地址：Bridging the ...

2019-12-30 10:40:54 6398

原创 CenterFace解读轻量级anchor_free人脸检测器

论文地址：https://arxiv.org/ftp/arxiv/papers/1911/1911.03599.pdfgithub地址：https://github.com/Star-Clouds/centerface此篇文章是参考的Objects as Points,在此附上Objects as Points的论文地址：Objects as Points核心思想，相比于Anchor的检测...

2019-11-14 09:02:03 6527

原创 LFFD(A Light and Fast Face Detector for Edge Devices)论文粗解

首先，这是一篇关于CV领域中目标检测的文章，本文只是记录与分析其中的特点，若是对目标检测没有基本了解的同学，可出门右转。原论文地址:https://arxiv.org/pdf/1904.10633.pdf代码地址:https://github.com/YonghaoHe/A-Light-and-Fast-Face-Detector-for-Edge-Devices且，本博主比较懒，所以就不画...

2019-09-27 00:12:13 640

原创模型量化基础知识

以FP32转INT8为例，记录量化最基本的流程：首先是量化的公式INT8 的取值范围为-128 127FP32的取值范围为(2−2−23)×2127,(223−2)×2127(2−2^{-23})×2^{127},(2^{23}−2)×2^{127}(2−2−23)×2127,(223−2)×2127详细见定点和浮点区别定点与浮点而量化主要就是把FP32的值域压缩到INT8从上面的取值...

2019-07-22 19:35:34 2673 3

原创 DSFD(Dual Shot Face Detector)论文解读

原文连接：DSFD本文仅记录DSFD的主要创新点，不考虑训练的调参过程。且对SSD类检测算法不不知道的人可以先去学习SSD以及特征融合等相关论文。DSFD 三大创新点：Feature Enhance Module (FEM)Progressive Anchor Loss (PAL)Improved Anchor Matching(IAM)Feature Enhance ModuleFE...

2019-05-07 10:18:11 3666

原创 caffe 安装报错修改

fatal error: hdf5.h:Makefile:588: recipe for target '.build_release/src/caffe/solvers/sgd_solver.o' failedmake: *** [.build_release/src/caffe/solvers/sgd_solver.o] Error 1参考(https://blog.csdn.net/...

2018-11-06 11:28:15 1013

原创前景提取算法调研

前景提取算法调研总结：前景提取算法，主要是用于在摄像监控中，从视频流数据中剔除不需要分析的背景部分，从而提升算法对视频分析的效果。在前景提取中主要分为两大类，一个是静态的前景提取：即摄像头是固定不动的相对的背景基本是不变化的，另一个时动态前景提取：即摄像头是追踪某个运动的物体背景是随着追踪的物体进行变化的。在本文中，主要是分析静态前景提取的方法。前景提取的主要有三大难点：1）视频流因光线等因...

2018-09-26 11:16:48 2716

原创 PCA 以及 SPCA

本文主要为PCA(principal component analysis)的学习记录以及SPCA(sparse principal component analysis)的学习记录因为关于PCA的原理很多博客以及书本介绍了很多，这个不单独记录。首先是PCA即变化过程： 1.假设原始的数据为X 是一个n*p的矩阵， p为数据的维度， n为数据的个数。 2.将X的每一行进行零均值化。 3.计算X

2018-04-25 19:19:27 4083 3

原创 Finite Markov Decision Processes

个人学习记录虽然DQN的发展，让RL在应用上有了很大的提升，但是很多思想还有可以从以前的方法中找到影子。其中DQN和Policy gradient都是可以从Q-learning和MDPS中找到参考。下面具体介绍MDPS的过程。符号对应的意义$$

2018-03-21 10:13:53 249

原创 reinforcement learning Finite Markov Decision Processes

之前记录了在state稳定的情况下或者，state对policy没有影响的情况。但是，在大多数情况下，state是对policy有很大影响的，因此本章主要是学习最初级的RL中马尔科夫决策过程参数定义状态 S： state –当前环境的情况。收益R ： reward –所得到的回报。行为A：action – agent做出的行为。决策P：policy –做出行为的判断依据。最优化对比：

2018-01-29 19:09:17 227

原创 text matching

本文章记录关于text matching相关文章的记录：前提概述： text matching是一种端到端的文本匹配的算法，主要用与搜索引擎，问答系统等，主要是为了找到与目标文本最相关的文本。如和问题最相关的答案，在搜索引擎中找到与搜索框中关键词最相关的网页等。MatchPyramid 文章来源：Text Matching as Image Recognition 主要方法：构建文本与文本

2017-12-13 10:40:33 2286

原创 Reforcement Learning ---- Multi-armed Bandits

个人学习记录初学强化学习，遇到的第一个情景假设—-多臂赌博机在说明多臂赌博机之前，先假设单臂的赌博机，或者说，单个的赌博机。我们知道，赌博机是大家去从N个当中去选择一个，去赌是否自己所选的是否会中奖。但是，问题在于我们并没有那么多本钱去不断的去尝试来得到最优的选择方法。这是单个赌博机的情况。而多臂赌博机则可以看成是同时有多个赌博机需要我们去选择。首先要明确，是多个赌博机而不是

2017-11-21 14:45:52 1001

原创 DQN 以及 DQN的扩展

本文主要记录关于DQN(Deep Reinforcement Learning)的相关论文以及loss function 以及近几年在DQN的基础上进行改进的算法。若要了解强化学习或者DQN本身原理的，可以出门左拐。DQN paper Playing Atari with Deep Reinforcement Learning loss function(Rt+1+γt+1maxa′qθ¯(S

2017-10-17 11:30:34 604

原创多任务学习进化史

(未经允许，不得转载) 本文结合各个博客以及论文整理的资料，如有版权问题，请告知。首先多任务学习的定义：我们常说的多任务学习其实有3种情况： 1）同一dataset，要解决不同的task。例如：针对一篇文章进行分词、词性标注、句法分析等，所用的数据都是一篇文章，但是对应的task不同。 2）不同的dataset，解决相同的task。例如：对不同学校的学生成绩进行预测问题。本文主要介绍

2017-10-17 09:45:59 765

原创 graph embedding(常见的图embedding的方法)

在图计算中，如何把图中的结点进行嵌入变成可计算的值或者向量一直是现在研究所关注的问题，初次学习，记录常用的embedding的方法。主流方法主要有三大类： 1）factorization methods 2） random walk techniques 3） deep learning 本文主要介绍第一类和第二类中比较知名的算法，若有不足欢迎补充。 1）factorization m

2017-10-09 17:30:58 23889 1

原创 Variational Inferecne

思路：在有隐变量涉入时求贝叶斯后验概率时通过KL散度解决分母不可求的问题。p(n1:K,z1:n|x1:n)=(∏Kk=1p(μk)∏ni=1p(zi)p(xi|zi,μ1:k)∫μ1:k∑z1:n∏Kk=1p(μk)∏ni=1p(zi)p(xi|zi,μ1:k))p(n_{1:K},z_{1:n}|x_{1:n}) = \left(\frac{\prod_{k=1}^Kp(\mu_{k})\pro

2017-03-26 22:19:10 260

原创空间向量相似性计算

计算空间相似性方法：皮尔逊相关系数，欧氏距离，余弦相似性，Tanimoto系数，曼哈顿距离。

2017-03-22 16:00:45 1403

ckqsars的博客