自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 资源 (5)
  • 收藏
  • 关注

原创 【三维重建】三角网格中轴骨架线提取

基于距离变换的方法基本原理:首先计算三维网格中每个点到网格边界的距离,形成距离场。然后,根据距离场的分布,通过细化算法提取中轴线。这种方法的核心在于距离变换和细化操作的结合。步骤:对三维网格进行距离变换,计算每个点到最近边界的距离。对距离变换结果进行排序,优先处理距离较小的点。通过细化算法逐步剥离外层点,直至提取出中轴线。基于中轴球的方法基本原理:为每个网格端点计算一个中轴球,中轴球的中心即为中轴点。通过计算所有网格端点的中轴球,最终生成中轴网格。

2024-08-31 18:44:48 378

原创 【立体匹配】双目相机外参自标定方法介绍

双目相机外参自标定方法是一种无需固定标定板,在拍摄实际场景的两张图像时,通过计算两幅图像之间的匹配特征点对,结合相机的内参矩阵,来实时求解两个相机之间相对位置(即外参)的方法。双目相机外参自标定基于双目立体视觉原理,通过匹配两幅图像中的对应点,利用这些匹配点对以及相机的内参矩阵,计算出两个相机之间的旋转矩阵和平移向量,即外参矩阵。这种方法避免了使用固定标定板的繁琐过程,提高了标定的灵活性和实时性。畸变校正:首先,利用已知的相机内参矩阵对两幅原始图像进行畸变校正。这是因为在相机成像过程中不可避免的安装误差。

2024-08-31 18:30:35 281

原创 【三维重建】三维网格后处理流程介绍

三维网格后处理流程是一个复杂而精细的过程,它涉及多个步骤以确保网格模型的质量、精度和适用性。孔洞修复检查网格中是否存在孔洞。检查修复非流形边和顶点,确保网格的拓扑结构正确无误。优化网格的拓扑结构和顶点分布,以提高网格的几何精度和物理仿真性能。在保持网格特征的前提下,删除冗余的数据点和面片。网格细化是指通过增加网格中单元的数量,来减小网格尺寸并提高网格的分辨率的过程。在简化过程中,特别注意保持网格的重要特征。网格平滑减少网格表面的噪声和不平整度,提高网格的视觉质量。将处理后的三维网格导出为标准格式,如OBJ等

2024-08-17 19:12:09 130

原创 发型编辑论文和开源代码汇总

hair mapper hairclipv2 edit 配置环境步骤复杂https://github.com/Taeu/Style-Your-Hairhttps://github.com/dukebw/LOHOhttps://github.com/tzt101/MichiGANhttps://github.com/gwang-kim/DiffusionCLIPhttps://github.com/orpatashnik/StyleCLIPhttps://github.com/IIGROUP/TediGAN

2024-04-30 09:53:54 545

原创 【掌静脉识别】掌静脉识别入门资料--数据及发表文章汇总

目前搜集到的数据集掌纹,掌静脉数据集The IIT Delhi palmprint image databaseHong Kong Polytechnic University Contact-free 3D/2D Hand Images Database香港理工大学公开的都在这个网站,需要申请…CASIA多光谱 poly U, tongji U论文合集 palm print recognition ,palm vein verification , feature extra matching

2024-03-28 17:20:05 1570 1

原创 【三维重建】3D Reconstruction 学习笔记 (Part-2)

三维重建学习笔记第二部,sfm 运动结构恢复,slam系统定位导航重建。多视图几何。极线。求解摄像机内参 外参数矩阵,描述了三维世界到二维像素的映射关系。欧式空间(2d一一对应齐次空间 (3d),反过来不是。坐标系转换:相机坐标系像素坐标系。m不是真实的投影矩阵,差一个放大系数。影消点 影消线 是一个确定的点 线。焦距:相机的焦距 不是透镜的。K有几个自由度,5DOF。制造工艺造成摄像机偏移。相机坐标系下的相机模型。3D空间中的无穷远平面。三维到二维的映射关系。2D平面上的无穷远点。2维平面中的无穷远线。

2024-03-22 18:07:49 583

原创 【三维重建】3D Reconstruction 学习笔记

三维网格重建学习笔记Part2链接:https://blog.csdn.net/qq_35200351/article/details/136947058课程链接: 北邮团队 https://cv-xueba.club/index.html摄像机模型对焦三维到二维的映射关系焦距:相机的焦距 不是透镜的坐标系转换:相机坐标系像素坐标系其他:图像坐标系不是线性变换齐次坐标欧式空间2d一一对应齐次空间 (3d),反过来不是转换为线性变换了摄像机的投影矩阵制造工艺造成摄像机偏移相机坐标系,三维重建

2024-03-22 14:17:31 537

原创 TPU-MLIR量化及识别模型效果测试

TPU-MLIR量化及人脸识别模型效果测试建议查看官方文档,这里只是做下步骤记录。docker 编译环境量化步骤 1. transform 2. run calibration 3. model deployonnx和cvimodel效果对比

2024-03-06 16:29:19 421

原创 【人脸识别】人脸数据集汇总

处理color FERET Database数据,每个ppm文件被压缩,因此先解压再转换格式。python处理代码,imbd-face.csv dataset python处理代码,红外人脸数据CBSR NIR face dataset 下载即可用,webface emore

2023-07-26 09:33:57 567

原创 【人脸识别】Face Recognition 入门

找论文搭配 Sci-Hub 食用更佳 💪Sci-Hub 实时更新 : https://tool.yovisun.com/scihub/公益科研通文献求助:https://www.ablesci.com/人脸识别流程:检测、对齐、(活体)、预处理、提取特征(表示)、人脸识别(验证)传统方法试图通过一两层表示来识别人脸,例如过滤响应、特征直方图分布。学术圈进行了深入的研究,分别改进了预处理、局部描述符和特征转换,但这些方法在提高FR准确性方面进展缓慢。更糟糕的是,大多数方法只针对不受约束的面部变化的一

2023-04-25 21:05:31 2308 1

原创 【立体匹配】传统/深度双目立体匹配方法总结

双目立体匹配一般分为代价计算,代价聚合,计算视差,后处理等步骤。立体校正的Bouguet算法旨在使两幅图像中每幅图像的重投影变化最小化的同时最大化双目视图的公共视野。相机拍摄的一个特定物体(世界坐标系),其相对于相机坐标系统的姿态可用 旋转 和 平移 进行描述。平移向量是以物体中心为原点的坐标系到以相机中心为原点的坐标系的偏移量,因此,相应的平移向量为。cv::InputArrat R 此矩阵是补偿相机相对于相机所处的全局坐标系的旋转。其中(2)(3)为摄像机内参数,其中k3普通镜头不使用,鱼眼镜头要使用。

2023-01-30 10:49:16 4052 2

原创 立体匹配中remap重映射前后的坐标点对应算法(python版)

目标:双目立体匹配中需要求得人脸映射前后的坐标对应关系。

2022-10-24 12:50:39 1921

原创 【C++】项目记录...

c++ 项目记录...从文件中读取像素坐标,并排序 读取文件内容并据此创建新的文件夹 分割文件路径 以字符串中间的空格分割控制台输入

2022-09-23 16:35:09 380

原创 【立体匹配】C/C++实现双目校正及源码解析

C/C++实现双目矫正(不使用OpenCV)及矫正源码解析这篇文章是之前【要matlab标定数据做双目相机矫正OpenCV C++】的补充,再加上了双目矫正的原理及代码注释。本文所需数据为matlab标定的双目摄像头外参及内参,具体使用stereoCameraCalibrator 步骤可看之前那篇文章。后续将会实现CPP版本的双目标定,又挖了个坑😓。找paper搭配 Sci-Hub 食用更佳 (๑•̀ㅂ•́)و✧Sci-Hub 实时更新 : https://tool.yovisun.com/sci

2022-04-20 18:07:42 6130 2

原创 C/C++ 实现矩阵运算(罗德里格斯,逆,行列式,转置)

C/C++ 实现矩阵运算(罗德里格斯,逆,行列式,转置)由于工程需要实现一些矩阵运算功能,在这里贴一下/* 3X3矩阵求逆 */ temp = PR[0][0] * PR[1][1] * PR[2][2] + PR[0][1] * PR[1][2] * PR[2][0] + PR[0][2] * PR[1][0] * PR[2][1] - PR[0][2] * PR[1][1] * PR[2][0] - PR[0][1] * PR[1][0] * PR[2][2] - PR[0][0] * PR[

2022-03-17 17:19:23 2568

原创 【立体匹配】使用matlab标定双目数据做相机校正OpenCV C++

双目相机矫正matlab c++ cpp双目标定及矫正系列文章更新,C/CPP实现双目矫正(不使用OpenCV)及矫正源码解析。matlab标定较为准确,命令行中输入stereoCameraCalibrator enter添加左图 右图 确定选择畸变参数,calibratior拖拉红线,删除误差大的图像对,使投影误差小于0.1最好。然后导出标定参数。需要用到 上图中的R T 是右相机相对于左的旋转平移矩阵,属于外参和相机内参 其中 R T 畸变注意顺序 k1 k2 d1 d2 k3, 源码

2022-02-18 17:02:41 3593 2

原创 C++底层OpenCV源码

查看OpenCV的底层源码安装CMake在整个解决方法中查找

2022-02-15 17:45:11 2127

原创 配置微软Azure Kinect DK 录制器k4arecorder

配置微软Azure Kinect DK 录制器k4arecorder1.新建解决方案添加Azure Kinect NuGet 包2. 使用Kinect录制3. python进行录制https://docs.microsoft.com/zh-cn/azure/kinect-dk/build-first-app1.新建解决方案添加Azure Kinect NuGet 包添加该包,可以使用程序包管理器 UI:右键单击“引用”,然后从解决方案资源管理器中选择“管理 NuGet 包”。选择nuget.org

2022-02-08 16:55:42 2875

原创 双目深度估计 立体匹配 论文综述及数据集汇总 Deep Stereo Matching paper review and dataset

双目深度估计立体校正标定 立体匹配 论文综述及数据集汇总 paper review and dataset StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction. Single View Stereo Matching. Generalizing Deep Stereo Matching to Novel Domains. KITTI InStereo2K eth3d middlebury

2022-01-09 00:04:07 7353

原创 利用ONNX进行PyTorch模型部署

使用ONNX进行PyTorch模型部署程序错误torch转换onnxonnx进行量化2程序错误torch转换onnxpip install onnxpip install onnxruntime // cpupip install onnxruntime-gpuhttps://onnxruntime.ai/import torchimport torch.nn as nnimport onnximport numpy as npclass Model(nn.Module):

2022-01-07 17:28:56 1151 3

原创 卷积神经网络AlexNet VGG ResNet DenseNet ShuffleNet MobileNet GhostNet EfficientNet RepVGG

卷积神经网络AlexNet VGG ResNet DenseNet ShuffleNet MobileNet GhostNet EfficientNet RepVGG1.ResNet2.DenseNet3.ShuffleNet4.MobileNet5.GhostNet6.EfficientNet7.RepVGG8.BN,SE,【图像去噪 paper 系列 (1) (2)】【文档图像二值化数据集 databases】【文档图像二值化 paper 系列 -1- | 系列 -2-】找paper搭配

2021-12-28 22:52:31 2089

原创 ubuntu系统dockerfile创建深度学习环境

1.新建dockerfile 没有后缀名touch dockerfilevim dockerfileARG CUDA_VERSIONFROM nvidia/cuda:${CUDA_VERSION}-cudnn7-devel-ubuntu16.042. docker run --name rv rastervision:pytorch /bin/bash

2021-11-30 17:51:44 1226

原创 Docker容器搭建运行GPU深度学习环境

nvidia-smi| NVIDIA-SMI 495.44 Driver Version: 495.44 CUDA Version: 11.5 docker容器搭建运行GPU深度学习环境docker run --gpus all nvidia/cuda:11.0-base nvidia-sminvidia-container-cli -k -d /dev/tty info

2021-11-24 14:02:04 2691

原创 python依据经纬坐标计算两点距离并求图像横纵分辨率

依据经纬坐标计算地球两点距离并求图像分辨率输入:geotiff图像文件输出:两点距离和图像分辨率缺点:未将投影方式纳入考虑范围, 处理高纬地区可能精度失真。import math, gdalfrom geopy.distance import geodesicfrom osgeo import gdal, osrimport numpy as npfrom math import sin, asin, cos, radians, fabs, sqrt haversione公式计算球面两点间

2021-11-22 14:25:59 4041

原创 OpenCV之字符轮廓、凸包和最小外接矩形

标记字符轮廓信息; Jarvis' March步进法求字符凸包; 旋转卡壳算法求最小外接矩形(1,从上至下,从左至右依次遍历图像。(2,如下图A所示,iwi_wiw​为遇到一个外轮廓点,且没有被标记过,则给A一个新的标记号。我们从A点出发,按照一定的规则将iwi_wiw​所在的外轮廓点全部跟踪到,然后回到iwi_wiw​点,并将路径上的点全部标记为A的标号。(3,如下图B所示,如果遇到已经标记过的外轮廓点iw​′,则从iwi_wiw​′向右,将它右边的点都标记为w​′的标号,直到

2021-11-01 13:26:21 2493

原创 Docker容器搭建运行python深度学习环境

任务管理器中查看虚拟化已启用若禁用,重启电脑,到Bios中开启安装Docker Desktop及开启WSL功能。powershell xshelldocker容器和本地机器互传文件docker cp [本地路径] 容器id:[容器内路径]docker cp D:\docker\raster-vision\test.py 7837a6060f9d:/opt/src/code/test.pydocker cp 容器id:[容器内路径] [本地路径] 查看所有镜像 docker image.

2021-10-20 15:23:24 322

原创 计算机视觉方向数据集汇总(更新中)

建筑物提取数据集1. Aerial Image Segmentation Dataset文档分类数据集2.Chinese Ethnic Ancient Handwritten Documents database, CEAHD2021-5文档图像二值化数据集3.德宏傣文古籍图像二值化数据集Tai Le historical document image binarization dataset, TLHDIBD2021版面分析数据集图像去噪数据集姿态估计数据集目标检测数据集文字识别数据集

2021-10-09 15:20:42 1558 5

原创 尺度不变特征变换(Scale-invariant feature transform,SIFT)

尺度不变特征变换 SIFT步骤:构建尺度空间,检测极值点,获得尺度不变性。特征点过滤并进行精确定位。为特征点分配方向值。生成特征描述子。SIFT特点:图像的局部特征,对旋转、尺度缩放、亮度变化保持不变,对视角变化、仿射变换、噪声也保持一定程度的稳定性。独特性好,信息量丰富,适用于海量特征库进行快速、准确的匹配;多量性,即使是很少几个物体也可以产生大量的SIFT特征;高速性,优化后的SIFT匹配算法甚至可以达到实时性;扩展性,可以很方便的与其他的特征向量进行级联组合。CNN:能够有效

2021-10-06 21:37:05 822

原创 开源 Python OpenCV 小项目

1. Drowsiness Detector 睡意检测环境配置import cv2 # opencv-pythonimport dlib #from scipy.spatial import distance若pip install报错,需要先安装boost和cmakepip install boostpip install cmakepip install dlib还安装不上的话,点击该链接下载VSdef calculate_EAR(eye): A = distance.euc

2021-10-06 21:09:58 1208

原创 图像的传统特征和深度特征介绍及其提取方法

找论文,scihub,传统图像特征及深度特征提取1. 传统图像特征1.1 统计特征1.2 纹理特征2. 图像深度特征1. 传统图像特征1.1 统计特征粗网格、方向线素、穿透数、不变矩阵1.2 纹理特征 LBP HOG GLCMLocal Binary Pattern(LBP), Gabor, Histogram of Oriented Gradient(HOG)灰度共生矩阵GLCM2. 图像深度特征设计神经网络模型来挖掘图像更深、更为抽象的特征。原图经卷积网络后随深度增加,特征随之抽象。

2021-06-24 16:28:40 6474

原创 图像去噪论文综述(更新中...)

2018 When Image Denoising Meets High-Level Vision Tasks: A Deep Learning Approach code【图像去噪 paper (1) (2)】【文档图像二值化数据集 databases】【文档图像二值化 paper 系列 -1- | 系列 -2-】找paper搭配 Sci-Hub 食用更佳 (๑•̀ㅂ•́)و✧Sci-Hub 实时更新 : https://tool.yovisun.com/scihub/公益科研通文献求

2021-06-17 17:44:35 724

原创 python 常用功能函数-文件操作 正则 运行命令行

python 常用功能函数1. 取文件前缀和后缀名2. 判断后缀名是否为某一文件类型3. 文件从A文件夹移动到B文件夹4. 文件从A文件夹移动到B文件夹并重命名5. 获取文件路径中最后一个文件夹名6. os.path 模块的常用方法7. 正则表达式8.运行命令行

2021-05-31 19:21:49 160

原创 文档图像二值化DIB-图像质量评价指标

文档图像二值化DIB-图像质量评价指标1. MSE, SNP, PSNR2. SSIM3. DRD4. FM,p-FM5. MPM,NRM图像相似度衡量指标1. MSE, SNP, PSNR 结构相似度指数 ssim Distance Reciprocal Distortion Metric对于任意的x和y的值,真实图像f(x,y)),模型生成的二值图像g(x,y),则误差e(x,y)=g(x,y)−f(x,y)。因此,两幅图像的总误差E为M×N个ei

2021-04-25 20:03:20 1132

原创 中国少数民族古籍数字化平台研究进展

中国少数民族古籍数字化平台中国是一个拥有 56 个民族的统一的多民族国家,中国自古 以来就是多民族聚居的国家,且拥有悠久的历史。各民族在历史上形成了丰富多样的古籍文献,本研究旨在对中国少数民族古籍进行数字化,保护优秀民族文化遗产。上世纪末,清华大学的丁晓青团队与各研究单位、高校开始民族文档的识别研究工作。2021年,少数民族文字古籍文档图像智能识别与文献数字化保护研究利用深度学习技术解决少数民族文字数字化难题。德宏 西双版纳 傣文,东巴文 纳西, 藏文,水书,蒙古文,维哈克文,满文,彝文,

2021-04-25 15:06:09 1850

原创 文档图像二值化论文 document images Binarization paper 2

与传统算法相比,该方法生成的二值图像具有更清晰的背景和更好的笔划保留,在广泛使用的DIBCO数据集上取得了最新的结果。由于输入图像的详细信息(例如边缘和边界)通常在更高的特征级别丢失,因此较低级别的特征可用于保留前景的高细节。文档图像二值化开发的DSN模型包括用于从文档图像中学习不同级别的文本特征的层级结构,从而文本和背景被分类。在文档分析方面,降级文档图像的二值化是一个具有挑战性的问题。大多数算法以无监督的方式构建在低级特征上,因此随后的输入域知识的充分利用的禁止显着限制了从前景区分背景噪声。 二值化论文

2021-04-21 10:55:43 1148 2

原创 古籍文档图像二值化数据集 document image binarization dataset

文档图像二值化是文档图像分析与识别流程中的一个重要步骤。必须有一个基准数据集和一个客观的评估方法来捕获当前文档图像二值化方法的效率。总体目标是使用已建立的评估性能度量记录机器打印和手写文档图像二值化的最新进展。古籍文档图像二值化;德宏傣文古籍图像二值化数据集 TLHDIBD2021

2021-04-20 15:51:49 1248 7

原创 图像噪声水平估计INLE_paper

图像噪声水平估计 Image Noise Level Estimation2013 Single-Image Noise Level Estimation for Blind Denoising (IEEE Trans. on image processing)找paper搭配 Sci-Hub 食用更佳 (๑•̀ㅂ•́)و✧Sci-Hub 实时更新 : https://tool.yovisun.com/scihub/公益科研通文献求助:https://www.ablesci.com/Abstrac

2021-04-09 20:06:49 3954

原创 语义分割FCN FPN UNet DeepLab HRNet SETR TransFuse...

图像分类:目标检测:语义分割:实例分割:FCN将CNN中的1维FC layers替换为对应的2维卷积层,类别信息也转换为对应的空间位置信息。5次下采样后,图像分辨率缩小32倍,在通过线性插值等上采样方式将分辨率增大至上一层大小,之后进行相加等融合…16倍…8倍.FCN-32s: # Convolutional layers transfered from fully-connected layers x = Conv2D(4096, (7, 7), activation='rel

2021-04-02 18:23:54 1969

原创 keras调用load_model时报错ValueError: Unknown layer:*解决办法

报的错误是ValueError: Unknown layer: SpatialPyramidPooling,使用了SPPnet用于分类。错误原因:keras中SPP不是默认存在的层,使用 load model 函数报错。解决:model.save('./vgg40e.h5')from keras.models import load_modelfrom keras.utils import CustomObjectScopewith CustomObjectScope({'SpatialPyr

2021-02-21 11:46:32 2879 5

原创 图神经网络GNN简介及应用方向

图神经网络(Graph Neural Network)链接:图神经网络原理及应用综述.ppt图是一种数据结构,图神经网络是深度学习在图结构上的一个分支。常⻅的图结构包含节点和边,其中,节点包含了实体信息,边包含实体间的关系信息。现在许多学习任务都需要处理图结构的数据,比如物理系统建模、学习分子指纹、蛋白质接口预测等。小样本学习、视觉问答、点云生成、分割、图像分类、图像标注、文本行切分。scihub、公益科研通。

2021-02-02 16:09:30 1182

掌纹识别 the palmprint feature extraction and classification tasks

mainly to complete the palmprint feature extraction and classification tasks. The data set contains 99 people's palm print pictures, in which 3 palm print pictures of each person are distributed in the training set, and the other 3 palm print pictures are distributed in the test set. In this project, I tried the traditional method use SIFT to extract features and KNN for classification which get accuracy of 97.31%, and also tried the convolutional neural network method such as ResNet which get a

2024-03-27

遥感图像分类EuroSAT.zip

遥感图像分类,共10类图像大小64*64。

2021-11-26

遥感图像的建筑物分类数据集.zip

遥感图像的建筑物分类数据集

2021-10-08

RCNN_17_flowers.rar

RCNN-keras所需样本集。The train_alexnet.py uses the 17flowers image folder with the train_list.txt file to perform the pre-training of the Alexnet. This is the file that need to be run first. After it generates the model_save.model file, you can run the fine_tune_RCNN.py file, which fine-tunes the model

2020-09-10

keras_fasterrcnn.zip

keras-faster-rcnn,基于keras的faster RCNN,自己调试好的,可在GPU上直接运行,将路径改一下就行了

2020-06-07

keras_yolo3_logodetection.zip

基于yolo v3和keras的Logo检测实现,文件包含示例文件、模型文件、readme、转换数据文件、简易demo及如何训练和预测,怎样替换自己的数据集等。

2020-05-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除