helton_yan-CSDN博客

原创【论文阅读】Relational Matching for Weakly Semi-Supervised Oriented Object Detection(CVPR‘24)

(弱半监督点标注有向目标检测)Relational Matching for Weakly Semi-Supervised Oriented Object Detection(CVPR'24)

2024-07-02 23:26:43 253

原创【论文阅读】Point2RBox (CVPR’2024)

Point2RBox(CVPR24)，点监督遥感有向目标检测

2024-06-05 14:02:03 366

原创【debug】windows11安装WSL+Docker+本地部署cvcat

然后将sources.list里的内容全部替换(dG全部删除)为清华源。打开http://localhost:8080/，注册一个账号。我们不想让它存储在C盘，可以将这个磁盘镜像文件移动到其它盘。wsl虚拟机的磁盘镜像文件存储在以下路径。运行docker容器，可能花费一些时间。在windows应用商店下载wsl。git下载cvcat标注工具源代码。然后可以删除.tar文件。

2024-05-28 19:57:38 615 1

原创【论文阅读】PointOBB(CVPR‘24)

PointOBB: Learning Oriented Object Detection via Single Point Supervision(CVPR'24)弱监督点到旋转框遥感目标检测

2024-05-27 11:54:49 395 2

原创【论文阅读】AID(ICCV‘23)

Anchor-Intermediate Detector: Decoupling and Coupling Bounding Boxes for Accurate Object Detection（ICCV'23）

2024-05-22 20:06:00 367

原创【论文阅读】Rank-DETR(NIPS‘23)

Rank-DETR for High Quality Object Detection(NIPS'23)

2024-05-21 00:59:31 441 5

原创【代码整理】Pytorch从0实现图像分类pipeline

包含完整基于pytorch的从数据集定义、网络模块定义再到训练，验证，测试的整个流程，适合小白入门深度学习和pytorch

2024-02-19 09:54:30 1176 1

原创【代码整理】COCO格式数据集画框

可以用于排查数据集转化后可能出现的坐标错误，类别不对齐等需要可视化才能发现的问题

2024-01-23 01:05:42 540

原创【代码整理】基于COCO格式的pytorch Dataset类实现

基于COCO格式的pytorch 自定义Dataset类实现

2024-01-20 23:25:54 950

原创【机器学习算法】主成分分析(PCA)

本文介绍了PCA降维的原理及在数据降维分析里的应用

2023-07-17 01:28:03 705

原创【机器学习算法】奇异值分解(SVD)

SVD分解的原理及其在图像处理中的应用

2023-07-17 01:18:05 2614

文章目录单目相机标定(基于Python OpenCV)1.上期填坑2.单目相机标定2.1 数据采集2.2 角点提取2.3 参数求解2.4 参数评估(重投影误差)2.5 相机位姿(棋盘位姿)可视化2.6 同Matlab标定结果比较单目相机标定(基于Python OpenCV)1.上期填坑在开始本篇博客之前，先填一下上一篇博客【计算机视觉】基于ORB角点+RANSAC算法实现图像全景拼接的坑(不算填吧，算做一个记录，因为并没有解决问题，留着看以后有没有空解决👀)，不想看的可以直接跳到下一节。首先解决如何

2022-05-21 02:38:44 4737 5

原创【计算机视觉】基于ORB角点+RANSAC算法实现图像全景拼接

基于ORB角点+RANSAC算法实现图像全景拼接文章目录基于ORB角点+RANSAC算法实现图像全景拼接数据采集基于ORB角点的图像特征提取与匹配基于RANSAC算法剔除误匹配点映射结果可视化在上一篇博客基于SIFT特征点检测实现图像匹配后，本篇博客将在之前的基础之上实现图像拼接。由于我本人买了盗版的书，书上的字迹不清晰看得难受之外，再加上博主水平有限，不太看得懂也不太想看书上的代码，所以在本篇博客，博主将按照自己理解的思路，手写pipeline还原图像拼接的大致流程。如有任何不严谨，代码冗余或者错误，

2022-04-16 02:00:32 6890 31

原创【计算机视觉】基于SIFT特征的校园建筑物匹配与视频流时序还原

文章目录计算机视觉之特征点检测与匹配1.Harris角点检测算法2.SIFT角点检测算法使用VLFeat开源库进行SIFT特征提取SIFT特征与Harris特征对比图像间的SIFT特征点匹配3.实战校园建筑物匹配数据采集匹配结果可视化4.实战视频流时序还原数据采集匹配结果可视化计算机视觉之特征点检测与匹配**角点检测(Corner Detection)**是计算机视觉系统中用来获得图像特征的一种方法，广泛应用于运动检测、图像匹配、视频跟踪、三维建模和目标识别等领域中。也称为特征点检测。角点通常被定

2022-03-31 02:32:16 4981 2

原创【计算机视觉】图像基本操作图像直方图直方图均衡化图像滤波 plt绘制图表

这里写目录标题1.什么是直方图直方图均衡化2.高斯滤波参考资料1.什么是直方图直方图是可以对整幅图的灰度分布进行整体了解的图示，通过直方图我们可以对图像的对比度、亮度和灰度分布等有一个直观了解。图像的直方图用来形象描绘该图像像素值的分布情况。我们用一定数目的小区间（bin）来指定表征像素值的范围，每个小区间会得到落入该小区间表示范围的像素数目。因此直方图不能显示图像中某像素所在的空间位置信息。同时也需要注意一点，不同的图像可能会有相同的直方图，所以不能用单独的直方图去恢复图像.绘制灰度图像直方图im

2022-03-17 00:44:09 588

原创【数字图像处理课程设计】基于非深度学习方法实现身份证定位与正反面识别

文章目录基于透视矫正与区域特征匹配的身份证图像定位与正反面识别摘要实现细节1.总体流程2.前景背景分割3.身份证角点定位4.透视变换5.模板匹配5.1 基于区域颜色匹配的国徽检测5.2 基于区域字符数统计的身份ID检测5.3 基于排版布局匹配的身份证正反面识别6.算法优化(基于视频流检测)6.1 面向识别算法的优化6.2 面向透视矫正算法的优化Github链接自取基于透视矫正与区域特征匹配的身份证图像定位与正反面识别摘要本次课程设计基于Python 开源计算机视觉库OpenCV实现了一种通用的基于

2022-01-15 15:21:35 5491 3

原创【C++课程设计】基于C++Qt的数字图像处理系统

本次 C++课程设计基于 C++ Qt 及 OpenCV 开源计算机视觉库实现了一项功能完备，界面简洁美观的数字图像处理系统。

2022-01-15 13:35:07 7190 8

原创【机器学习实验五】基于多分类线性SVM实现简易人机猜拳游戏

基于多分类线性SVM&mediapipe手势关键点实现简易人机猜拳游戏

2022-01-02 23:22:52 6491 5

原创【机器学习算法】基于前馈神经网络的反向传播算法解析

文章目录走向深度：深度学习前馈神经网络1.神经网络常见激活函数及其导函数sigmoidTanhReLU （线性整流函数 Rectified Linear Unit）Leakly ReLUPReLU(Parametric ReLU)ELU2.深度学习的基石：误差反向传播算法(Back Propagation)梯度下降，参数更新3.代码实战前馈神经网络分类优化一：对前向传播每一层的输出结果进行标准归一化(和BN有所不同，不包括可学习γβ)：优化二：更科学的权重初始化方法统一初始化为某数值随机初始化4.代码实战前

2021-12-26 23:44:21 1441 4

原创【机器学习算法】支持向量机入门教程及相关数学推导

经典线性二分类算法:支持向量机(SVM)可以毫不夸张的说，在深度学习算法尚未崛起之前，SVM一度是最受欢迎的机器学习算法之一。由于其优异的泛化性能以及鲁棒的应用场景，使其在学术界甚至工业界都有着十分广泛的应用。如果你翻看大约十年前的相关论文，就会发现SVM以及一些SVM的变体都是实验数据中不可缺少的Baseline和benchmark。以至于在CNN崛起之后，SVM算法推理过程的相对高效以及可解释性使得一些基于CNN的深度学习模型仍然使用SVM分类器执行流程中的特定任务，其中比较有名的要数目标检测算法RC

2021-12-25 23:25:20 1221

原创【机器学习算法】逻辑回归为什么叫逻辑回归

文章目录逻辑回归以及为什么叫逻辑回归从sigmoid函数引出逻辑回归的统计学模型：伯努利分布线性回归模型的通式：广义线性模型指数族分布逻辑回归以及为什么叫逻辑回归逻辑回归虽然名字里有回归(logistic regression)，实则它是个二分类算法。从sigmoid函数引出同多元线性回归一样，逻辑回归也具有它的函数表达式：hθ(x)=g(θTx)=11+e−θTxh_{\theta}(x)=g\left(\theta^{T} x\right)=\frac{1}{1+e^{-\theta^{T}

2021-12-15 12:58:45 2445 1

原创【C++学习五】STL库的应用

文章目录初识C++之 STL标准库1. C++STL的三大核心组件2. 自定义函数与算法对容器实现操作3. 基于自定义函数以及操作模板实现简易数字图像处理3.1 图像灰度变换3.2 图像二值化4. 初识STL容器之：set集合5.初识STL容器之：map(关联容器)结语初识C++之 STL标准库STL 是 Standard Template Library 的缩写，中文译为“标准模板库”。STL 是 C++ 标准库的一部分。我们之前已经基本了解了C++中的模板templet，以及模板的作用。可以说，C

2021-11-26 00:33:37 2690 1

原创【机器学习实验四】基于Logistic Regression二分类算法实现手部姿态识别

文章目录Logistic 回归实现手势识别1. 想法构思一些细节2. 实现流程2.1 数据采集与预处理2.1.1基于mediapipe工具包的手部关键点提取手部关键点可视化2.1.2 将关键点的绝对坐标转化为相对距离2.1.3 搭建logistic回归算法2.1.4 训练细节2.1.5 算法测试(嵌入mediapipe手部关键点提取代码中)3. 算法改进本次实验的所有代码已上传个人github仓库：https://github.com/Scienthusiasts/Machine-LearningLog

2021-11-23 00:16:53 11844 7

原创【机器学习算法】为什么交叉熵可以用作逻辑回归(分类模型)的损失函数 ?

文章目录逻辑回归的损失函数以MLE角度理解交叉熵以信息论角度理解交叉熵信息熵K-L散度(相对熵)交叉熵(Cross Entropy)推导逻辑回归损失对参数的梯度使用逻辑回归实现乳腺癌数据集二分类逻辑回归的损失函数有两种方式可以推导出二分类交叉熵损失函数，一个是通过极大似然估计法，另一个则是信息熵。以MLE角度理解交叉熵参考之前如何推导多元线性回归的损失函数，我们可以总结一下这个思想：那就是，一个预测模型的背后，一定都会假设预测结果服从某种分布，然后通过对该分布构建似然函数，紧接着使用极大似然估计，最

2021-11-21 09:55:25 1717 4

原创【机器学习算法】基于最小二乘损失(MSE)的多元线性回归解析解推导

目录推导多元线性回归损失函数的解析解推导过程详解凸函数与最优化代码实战：波士顿房价预测推导多元线性回归损失函数的解析解基于上一节的博客我们基于概率统计中最大似然估计的角度推导了多元线性回归的损失函数，但没有给出具体求解该函数的方式，在本节中我们将再次硬核一波，利用数学公式推得该损失函数的解析解形式。(至于为什么是解析解，这是因为多元线性回归其数值解基于样本的不同而不同，我们只能求出解的函数表达式，最后再通过计算机求出精确解)推导过程详解多元线性回归损失函数：loss=∑i=1m(y(i)−θTx(

2021-11-17 20:45:22 4040 1

原创【C++学习四】对于C++模板与智能指针的理解

文章目录初识C++之：模板与智能指针1.函数模板1.1 一般模板函数1.2 特化模板函数2.类模板2.1 成员模板函数成员模板函数特化2.2 模板类特化全特化偏特化3.智能指针初识C++之：模板与智能指针在日常编程过程中，无论是定义变量，类成员，还是定义某个函数的传入参数或return类型，亦或者类中的某个实现方法。一般情况下我们都需要赋予这些参数具体的类型(可以是int， float或是某个class)，然而在很多情况下，某些函数除了传入参数以外，其中的实现方法其实完全相同。这时候，一般有两种解决方案

2021-11-17 00:38:10 1329

原创【机器学习实验三】纯手撕三种朴素贝叶斯算法(Naive Bayes)，并进行IMDB影评数据集分类及手写数字识别

全角度解析朴素贝叶斯(Naive Bayes)：一种基于生成式学习策略的机器学习算法本篇博客的所有代码均已上传个人Github仓库：https://github.com/Scienthusiasts/Machine-Learning1. 算法简介如果要将当今的机器学习算法以统计学习的角度建模的话，一般可以划分为两个大的策略。一种属于判别式模型(discriminative models)，另一种是生成式模型(generative models)，本篇博客所要介绍的算法：贝叶斯分类器，或者说是朴素贝叶斯

2021-11-10 22:50:37 2282 1

原创【C++学习三】C++多态性

文章目录初识C++ 之多态性1. 虚函数1.1 一般多态性函数1.2 特殊多态性函数1.3 析构函数的多态性1.4 纯虚函数2. 虚继承3. 总结初识C++ 之多态性在C++语言当中，多态性是通过虚函数(virtual)来实现的，虚函数允许子类重新定义成员函数，而子类重新定义父类的做法称为重写(Override)1. 虚函数虚函数是实现C++多态性必不可少的关键，首先我们来探究一下虚函数的具体作用：比如说，我们现在定义一个基类Base0，它内部成员如下：class Base0{ p

2021-10-31 17:44:52 594 1

原创【C++学习二】C++继承

文章目录初识C++之继承1. 继承访问权限测试(类内部成员的权限)2.继承访问权限测试(继承的权限)使用using提升成员权限3.C++友元3.1 友元函数3.2 友元类友元类继承测试(友元的作用域)总结初识C++之继承c++作为一门OO语言，怎么能少得了继承？在面向对象语言当中，继承允许我们依据一个类来定义另一个类。继承的特性在于，新的类默认含有继承类的一些属性与方法。这使得创建和维护一个应用程序变得更容易。这样做，也达到了重用代码功能和提高执行效率的效果。当创建一个类时，我们不再需要重新编写新

2021-10-31 17:38:50 391

原创【机器学习实验二】决策树(Decision Tree)及其在图像识别任务上的应用

经典有监督学习算法：决策树(Decision Tree)文章目录经典有监督学习算法：决策树(Decision Tree)1.算法简介2.算法思想3.算法训练流程3.1 算法的大致流程3.2 算法的伪代码3.3 经典的属性划分方法3.3.1 先验知识 : 信息熵与条件熵信息熵的Python代码实现3.3.2 信息增益 (代表算法：ID3)信息增益python代码实现3.3.3 信息增益率 (代表算法：C4.5)信息增益率python代码实现3.3.4 基尼系数 (代表算法：CART)信息增益率python代

2021-10-26 21:58:54 6081

原创【机器学习算法】以最大似然估计角度理解多元线性回归损失(最小二乘法)

文章目录以极大似然估计角度推导多元线性回归损失函数从一元线性回归开始多元线性回归误差项的概率密度函数误差项的极大似然函数求解极大似然函数，推得多元线性回归的损失函数以极大似然估计角度推导多元线性回归损失函数从一元线性回归开始以一元线性回归为引：一元线性回归的函数表达式：y=wx+b+ε\mathrm{y}=\mathrm{wx}+\mathrm{b}+\varepsilony=wx+b+ε即待遇测的变量y同输入x大体呈一元线性关系，这里的epsilon表示预测结果与真实值之间存在的误差多

2021-10-11 16:47:15 997

原创【C++学习一】C++实战CMatrix类的创建

C++实战：CMatrix类的实现1.头文件声明 Cmatrix.h头文件主要用于声明CMatrix类以及类内部的属性和构造函数，和各种实现方法。#ifndef CMATRIX_H#define CMATRIX_H#include <iostream>using namespace std;class CMatrix{public: // 构造器 CMatrix(); CMatrix(int nRow, int nCol, double *pDat

2021-10-07 20:08:58 641

原创计算机也能成为艺术家？(基于论文A Neural Algorithm of Artistic Style的图像风格迁移)

计算机也能成为艺术家? ：基于论文 A Neural Algorithm of Artistic Style 的图像风格迁移先不急着到达最精彩的地方，在这之前，让子弹再飞一会。引言卷积神经网络能做什么？不论是图像识别，物体检测，图像分割或是场景重建，CNN早已经在计算机视觉的各种任务上大放异彩。对于CV研究者而言，2012年就像一个分水岭。2012年以前，在CV任务上的研究重点倾向于如何设计更好的人工特征，2012年以后，研究方向发生了180度大转弯，人工特征被渐渐抛弃，取而代之的是越来越复杂，能够

2021-09-23 23:52:55 1189

原创【机器学习实验一】手撕 kNN(K-Nearest Neighbor, k最邻近算法)

文章目录kNN算法1.算法简介2.算法思想3.算法流程kNN算法的一般流程伪代码4.代码部分kNN算法的python实现kNN实现手写数字分类数据集部分可视化预测，计算accuracy5.实验部分(k的取值对决策的影响)实验结论实验代码6.算法优缺点kNN算法1.算法简介kNN算法全称叫k-Nearest Neighbors，即k最近邻算法。1968年由 Cover和 Hart 提出。在机器学习算法中，kNN算法的思想简洁，可解释性强，同时也是一个有监督学习通用算法(既适用于分类问题也适用于回归问题)

2021-09-16 10:41:34 7457 4

原创基于PyTorch的卷积神经网络经典BackBone(骨干网络)复现

文章目录前言1.VGG1.1改进：1.2 PyTorch复现VGG191.2.1小Tips：1.2.2 打印网络信息：2.Inception(GoogLeNet)2.1改进(Inception v1)2.2.2改进(Inception v2)2.2 PyTorch复现Inception v1:2.2.1 网络的整体框架：2.2.2 各层的参数情况：2.2.3 pytorch复现Inception基础模块2.2.4 小Tips3.ResNet3.1改进3.2PyTorch 复现 ResNet-503.2.1R

2021-03-03 23:26:17 2686 5

原创适合新手的Sublime Text 配置 Python代码补全+代码对齐+断点调试+中文界面

安装插件首先Ctrl+Shift+P打开终端窗口,输入Install Package Control,重启，紧接着 Package Control:install Package,然后搜索想要安装的插件代码补全：Anaconda安装成功：重启Sublime，在编写代码时就会有自动提示补全功能代码对齐在启用Anaconda插件后，发现代码上多了许多小框框，去都去不掉：事实上这些框起来的代码是 Anaconda 认为不符合规范的地方，把光标移到那一行，底栏会显示具体哪里不符合规范：可

2021-02-26 15:42:04 2402 1

原创 [语义分割]基于VGG网络搭建FCN-8s并在VOC2012数据集上训练

文章目录1.数据集选取1.1数据集简介1.2 数据预处理1.2.1踩坑记录11.2.2 读取图片路径1.2.3 自定义图像增强与预处理模块1.3自定义数据集类1.3.1数据标签可视化2.搭建FCN-8s网络2.1基础FCN网络架构2.2一些细节2.3网络搭建2.3.1导入预训练神经网络2.3.2 FCN-8s pytorch 实现3.在VOC2012上训练3.1定义超参数3.2导入数据集3.3 实现评价指标 PA，MIOU3.4 实现train方法3.4.1 踩坑记录23.4.2pytorch使用GPU训练

2021-02-21 22:23:12 4738 10

原创 [图像识别]Pytorch搭建预训练VGG16实现10 Monkey Species Classification

[图像识别]Pytorch实现10 Monkey Species Classification文章目录[图像识别]Pytorch实现10 Monkey Species Classification1.数据集选取1.1下载地址1.2数据集描述2.自定义torch数据集类2.1自定义数据集需要实现哪些功能2.2自定义数据集可能会用到的库2.3自定义类中的数据预处理模块2.4实现自定义类中的方法：3.搭建预训练网络3.1预训练网络需要导入的库3.2导入预训练模型3.3搭建全连接层4.网络训练4.1网络训练需要的

2021-02-10 23:35:52 2337 2

原创 [图像识别]pytorch实现手写英文字母识别：

pytorch搭建CNN实现手写英文字母识别：目录pytorch搭建CNN实现手写英文字母识别：Part1.数据集选取：`The Chars74K` dataset：`EMNIST` dataset:Part2.数据预处理：Part3.网络搭建：Part4.训练与模型保存：Part5.模型读取并测试自己的数据：Part6.完整代码：Part1.数据集选取：The Chars74K dataset：http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/res

2020-12-23 01:01:56 20532 87

原创三个常用的screen命令

使用Linux服务器训练数据集时，训练时常通常需要长达几个小时甚至更久，期间若因种种原因与服务器断连或关闭窗口，之前的一切工作就白费了。screen可以看作是窗口管理器的命令行界面版本。它提供了统一的管理多个进程的功能，用户可以通过该命令同时连接多个本地或远程的命令行会话，并在其间自由切换，即使与服务器中断连接也不会影响各个进程到运行。screen -S [name]创建一个窗口，并且为这个窗口命名。screen -ls可以查看已创建的所有窗口。screen -r [name]重新连接到对应的

2020-12-04 17:59:20 298

EMNIST手写体数据集

空空如也