CV
文章平均质量分 72
易大飞
梦想贵在坚持!
展开
-
以矩阵的形式,对点或线段或多边形绕固定点旋转方法
其中x,y旋转前横纵坐标,x’,y’为旋转后横纵坐标。θ旋转角度,单位为弧度,大于零表示逆时针旋转,小于零表示顺时针旋转。tx,ty表示旋转物体的中心点。k为缩放因子[0,+ ∞]。±表示翻转,第一行正负号表示水平翻转,第二行正负号表示垂直翻转。,其中x,y旋转前横纵坐标,x’,y’为旋转后横纵坐标。θ旋转角度,单位为弧度。等价于:x’ = xcosθ+ysinθ,y’=-xsinθ+ycosθ。注:此矩阵仅为旋转矩阵,不包含平移和缩放。二、旋转+平移+缩放+翻转。原创 2023-09-19 11:27:45 · 655 阅读 · 0 评论 -
Ultra Fast Deep Lane Detection with Hybrid Anchor Driven Ordinal Classification论文解读
Ultra Fast Deep Lane Detection with Hybrid Anchor Driven Ordinal Classification论文解读原创 2022-07-22 18:55:46 · 2256 阅读 · 0 评论 -
Ultra Fast Structure-aware Deep Lane Detection论文解读
Ultra Fast Structure-aware Deep Lane Detection论文解读,论文及代码原创 2022-07-11 18:28:14 · 1817 阅读 · 0 评论 -
车道线检测——概述
车道线检测,是自动驾驶中重要的组成部分。该文主要对车道线检测做了简单的概括和总结。原创 2022-07-11 11:01:05 · 8334 阅读 · 1 评论 -
ViT-YOLO论文解读
ViT-YOLO论文解读原创 2022-07-01 19:18:54 · 4299 阅读 · 4 评论 -
TPH-yolov5论文解读
TPH-yolov5论文简介。原创 2022-06-27 19:14:33 · 13903 阅读 · 0 评论 -
5. VOLO: Vision Outlooker for Visual Recognition
VOLO的整体流程很简单:主要分为两个阶段,第一个阶段使用outlookattention + MLP获取图像特征,第二阶段使用普通attention + MLP获取图像特征,对此时获取的图像特征再执行classAttention提取分类token特征,最后进行类别划分。outlookattention (unfold + matmul + fold操作)...原创 2022-01-05 19:19:36 · 1985 阅读 · 0 评论 -
1. attention is all in need
在视频和github中有相关作者非常详细的讲解,感觉受益匪浅,因此学习记录。讲解视频:从中文Transformer到BERT的模型精讲,以及基于BERT情感分类实战_哔哩哔哩_bilibili视频笔记 github:https://github.com/aespresso/a_journey_into_math_of_ml/blob/master/03_transformer_tutorial_1st_part/transformer_1.ipynb...原创 2021-11-15 21:03:31 · 303 阅读 · 0 评论 -
2. vit——vision transformer
了解vit之前可以先看论文 attention is all in need,主要看论文中transformer中的encode和decode部分。在vit中主要应用了transformer的encode部分。vit整体的网络框架结构图vit原理讲解的很好:ViT和DeiT的原理与使用 - 知乎vit原理:把图像使用patch(p*p*c),分隔为N等份。每份拉成一维向量D。N等份就有N*D维度。因为分隔图片的patch尺寸可能会拉成很长的一维向量(比如patch尺寸为32,3通道。原创 2021-11-15 21:02:19 · 2627 阅读 · 0 评论 -
3. deit——Training data-efficient image transformers & distillation through
deit是vit的改进,使用的网络框架基本一致。主要参考:ViT和DeiT的原理与使用 - 知乎参考:DeiT:使用Attention蒸馏Transformer知识蒸馏中的教师网络,可以使用其他非transformer形式的网络结构,比如卷积网络(resnet,efficientnet)等。个人总结:deit和vit形式一直,在网路结构中多了一个distillation token,类似于class token的形式。distillation toke原创 2021-11-15 21:01:46 · 3033 阅读 · 0 评论 -
4. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
论文:https://arxiv.org/abs/2103.14030分类代码:https://github.com/microsoft/Swin-Transformer检测代码:https://github.com/SwinTransformer/Swin-Transformer-Object-Detection语义分割代码:https://github.com/SwinTransformer/Swin-Transformer-Semantic-Segmentation摘要:作者.原创 2021-04-21 20:36:38 · 405 阅读 · 0 评论 -
灰度图转换成彩色图和彩虹图
把灰度图转换成彩色图和彩虹图1. 灰度图转换成彩色图void Gray2Color(const cv::Mat const &src, cv::Mat &dst){ dst = cv::Mat(src.rows, src.cols, CV_8UC3); int tmp = 0; for (size_t y = 0; y < src.rows; ...原创 2020-03-27 09:41:59 · 5534 阅读 · 2 评论 -
opencv腐蚀和膨胀原理
腐蚀原理:假设原图像中有一个前景物体,那么我们用一个结构元素去腐蚀原图的过程是这样的:遍历原图像的每一个像素,然后用结构元素的中心点对准当前正在遍历的这个像素,然后取当前结构元素所覆盖下的原图对应区域内的所有像素的最小值,用这个最小值替换当前像素值。膨胀原理与这个原理正好相反。膨胀原理:假设原图像中有一个前景物体,那么我们用一个结构元素去膨胀原图的过程是这样的:遍历原图像的每一原创 2018-01-24 12:20:37 · 4239 阅读 · 4 评论 -
3000fps和ESR正确率对比
3K算法训练数据集:afw(图像337),helen(trainset图像2000),lfpw(图像811)。模型:Regressor.model(79MB),LBF.model(5.91MB)。测试数据集:helen(testset图像330)。正确率:92.25% ESR算法训练数据集:COFW(trainingImages图像1345)。模型:model.原创 2018-01-23 14:36:57 · 841 阅读 · 2 评论 -
代码C++, opencv实现人脸识别,人脸检测,人脸匹配,视频中的人脸检测,摄像头下的人脸检测等
前一段时间写了一个人脸相关的算法,包括视频中的人脸检测,相机的人脸检测,图像中人脸检测,还有人脸识别。使用的是VS2013和opencv。首先创建头文件common.h#ifndef _COMMON_H#define _COMMON_H#include #include #include #include #include #include #include #原创 2018-01-22 19:59:20 · 23716 阅读 · 41 评论 -
图像融合(一)--概述
这有几篇关于图像融合的文章,对于做图像的有一定的帮助。我转载的目的是为了以后自己处理图像时,能够及时复习相关知识。非常感谢相关作者的付出。http://blog.sina.com.cn/s/blog_149e9d2ec0102wxv3.html转载 2017-06-16 16:16:46 · 800 阅读 · 0 评论 -
图像融合(二)-- 简单加权融合
图像融合(二)-- 简单加权融合这个是简单加权的图像融合算法介绍,供自己以后学习。在此非常感谢写这篇文章的作者的共享。http://blog.sina.com.cn/s/blog_149e9d2ec0102wxv4.html转载 2017-06-16 16:21:22 · 2126 阅读 · 0 评论 -
opencv中统计时间的函数。
在opencv中我们需要统计函数或者某个功能消耗的时间。目前我总结两个时间函数来统计时间。1. getTickCout()2. getTickFrequency()原创 2017-08-01 15:28:24 · 742 阅读 · 0 评论 -
opencv中RNG产生随机数问题
使用opencv是经常会使用随机数,下面是我总结的几点随机数的使用情况。方便以后的学习使用。定义RNG类型后,常用的几个方法是:next,uniform,gaussian,fill,randu, randShuffl等几个常用的方法。1. next功能:去下一个随机数。使用实例:2. uniform功能:获取指定范围内的随机数使用实例:3.原创 2017-08-08 15:49:18 · 891 阅读 · 0 评论 -
OpenCV Error: Insufficient memory (Failed to allocate 47752340 bytes) in cv::OutOfMemoryError, file
最近在学习人脸检测的一篇论文:Face Alignment at 3000 FPS via Regressing Local Binary Features 时,运行相关的代码发现出现如下错误。Face Alignment at 3000 FPS via Regressing Local Binary Features出现这种错误大家一看就知道因为什么,那是因为内存不足导致的。当然其中之原创 2017-08-09 17:30:59 · 14821 阅读 · 2 评论 -
Face Alignment at 3000 FPS via Regressing Local Binary Features
Face Alignment at 3000 FPS via Regressing Local Binary Features 这篇论文(下面简称 3000fps)实现了对人脸关键点的高速检测,而且预测的精度也是相当的高。本文首先讲解了 3000fps 整篇论文的思路和方法,然后具体谈谈如何利用 C++ 实现这篇论文中的方法。论文解读3000fps总体上采用了随机森林和全局线性回归相结合的转载 2017-08-02 16:12:28 · 535 阅读 · 0 评论 -
opencv下使用摄像头
opencv下如何使用摄像头,#define _CRT_SECURE_NO_WARNINGS #include #include "opencv/cxcore.hpp"#include "highgui.h"#include "cv.h"using namespace std;int main(){ CvCapture* capture =原创 2017-08-21 16:58:35 · 312 阅读 · 0 评论 -
JDA使用cmake生成sln工程后不能编译的情况。出现如下问题。
JDA使用cmake生成sln工程后不能编译的情况。出现如下问题。debugging information for 'jda.exe' cannot be found or does not match.binary was not built with debug information.debugging information cannot be found or d转载 2017-08-24 16:04:36 · 458 阅读 · 0 评论 -
图像缩放--OpenCV cvResize函数--最近邻插值---双线性插值--基本原理
图像大小变换void cvResize( const CvArr* src, CvArr* dst, int interpolation=CV_INTER_LINEAR );src输入图像.dst输出图像.interpolation插值方法:CV_INTER_NN - 最近邻插值,CV_INTER_LINEAR - 双线性插值 (缺省使用)CV_INTER_AREA - 使用象素关系重转载 2017-09-08 16:58:08 · 740 阅读 · 0 评论 -
数据归一化和两种常用的归一化方法
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一化方法:一、min-max标准化(Min-Max Normalization)也称为转载 2017-10-28 14:48:17 · 1114 阅读 · 0 评论 -
flip函数翻转操作
flip函数是矩阵或者图像翻转,其实图像的本质也是矩阵。void flip(InputArray src, OutputArray dst, int flipCode) 参数:src,输入矩阵dst,翻转后矩阵,类型与src一致flipCode,翻转模式,flipCode==0垂直翻转(沿X轴翻转),flipCode>0水平翻转(沿Y轴翻转),flipCode原创 2017-10-16 10:23:57 · 5154 阅读 · 1 评论 -
A Deep Regression Architecture with Two-Stage Re-initialization for High Performance Facial Landmark
这是一篇2017年的cvpr上关于人脸对齐的文章。这篇文章整体上思路比较清晰,图1的流程比较简明,整个图就能够表明整个核心算法一切。原创 2017-11-02 16:02:03 · 1260 阅读 · 0 评论 -
Dynamic Attention-controlled Cascaded Shape Regression Exploiting Training Data Augmentation
这是关于Dynamic Attention-controlled Cascaded Shape Regression Exploiting Training Data Augmentation and Fuzzy-set Sample Weighting的相关简介,这个是我之前做的ppt大家可以学习一下。原创 2017-11-02 15:46:16 · 383 阅读 · 0 评论 -
Unconstrained Face Alignment via Cascaded Compositional Learning
针对论文Unconstrained Face Alignment via CascadedCompositional Learning,我做的简要总结。毕竟看来几天才看明白。原创 2017-11-02 15:28:34 · 625 阅读 · 0 评论 -
图像融合(三)-- 拉普拉斯金字塔
图像融合(三)-- 拉普拉斯金字塔这是关于拉普拉斯金字塔的图像融合策略,有相关算法和理论介绍,供自己以后的学习。也非常感谢作者的付出。http://blog.sina.com.cn/s/blog_149e9d2ec0102wxv5.html转载 2017-06-16 16:33:59 · 2565 阅读 · 0 评论 -
纹理特征简介
转载至:http://blog.csdn.net/carson2005/article/details/44676281纹理的定义:纹理是一种反映图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性。纹理具有三大标志:某种局部序列性不断重复、非随机排列、纹理区域内大致为均匀的统一体。纹理不同于灰度、颜色等图像特征,它通过像素及其周围空间邻域的灰度转载 2017-08-01 14:22:01 · 1291 阅读 · 1 评论