算法学习_dongxia_dl的博客-CSDN博客

算法学习

关注

关注数：文章数：97 文章阅读量：117996 文章收藏量：750

作者: dongxia_dl

这个作者很懒，什么都没留下…

展开

libopencv_core.so编译不出来

libopencv_core.so无效

原创 2023-03-09 14:17:37 · 693 阅读 · 1 评论
NTU RGB+D 数据集可视化脚本

NTU RGB+D数据集可视化

原创 2022-11-25 10:03:40 · 465 阅读 · 0 评论
tiny-yolov3输入图像resize过程解析

yolov3 预处理

原创 2022-09-27 11:06:23 · 428 阅读 · 0 评论
np.array和torch.tensor转换

torch.tensor

原创 2022-08-25 10:24:07 · 1674 阅读 · 0 评论
Python引入代码找不到路径的解决办法

Python 路径

原创 2022-08-23 09:37:31 · 1250 阅读 · 0 评论
本地编译openpose遇到“set_gpu_data“ error

caffe openpose gpu

原创 2022-08-01 17:45:49 · 215 阅读 · 0 评论
MOT 多目标追踪自动标注工具调研

总结的比较全面的帖子：https://www.reddit.com/r/computervision/comments/jryb5d/best_labeling_tool_for_object_tracking/superannotaionSuperAnnotate Desktop: A better alternative to free annotation toolsdeeplabel GitHub - jveitchmichaelis/deeplabel: A cross-platf

原创 2022-03-23 11:54:18 · 1365 阅读 · 0 评论
格灵深瞳招股书摘要-技术部分

以下内容仅供个人学习和借鉴，如侵权立删！一、经营模式公司主要从事计算机视觉技术和大数据分析技术的研发和应用。公司的盈利来源于向客户提供面向应用场景的人工智能产品及解决方案获得销售收入。公司自主研发的人工智能产品主要包括智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台。人工智能产品既可以单独销售，也可根据客户需求，将上述产品进行组合以整体行业解决方案向客户交付。报告期内，公司的主营业务收入主要来源于城市管理、智慧金融和商业零售三大业务领域的产品及解决方案的销售。二、竞争

原创 2022-03-22 09:57:09 · 368 阅读 · 0 评论
ubuntu18安装labelme后启动不了的问题解决

qt.qpa.plugin Could not load the Qt platform plugin xcb运行python 代码, 遇到标题中的报错。原来以为是qt的问题，尝试了baidu和bing各种办法都无济于事。后来终于参考某网页，把opencv-python版本由 4.5 下降为 4.3.0.36 ，问题解决。这已经是第二次由于opencv版本造成问题了。来源qt.qpa.plugin Could not load the Qt platform plugin xcb -.

原创 2022-03-18 11:49:54 · 1567 阅读 · 1 评论
rgb2gray的c++实现

template<typename _Tp> struct RGB2Gray{ typedef _Tp channel_type; RGB2Gray(int _srccn, int blueIdx, const float* _coeffs) : srccn(_srccn) { static const float coeffs0[] = { 0.299f, 0.587f, 0.114f }; // 三分量系数不同，人眼对绿色最敏感，所以G.

原创 2022-03-07 10:49:27 · 685 阅读 · 0 评论
多CUDA版本切换命令行

sudo rm -rf /usr/local/cudasudo ln -s /usr/local/cuda-10.2 /usr/local/cudanvcc --version

原创 2022-02-18 15:04:48 · 971 阅读 · 0 评论
pytorch Missing key(s) in state_dict

加载模型的时候，加上一个关键字 strictmodel.load_state_dict(pretrained_dict, strict=False) # 多GPU训练，单GPU推理 strict=False

原创 2022-02-11 11:06:16 · 1178 阅读 · 0 评论
pytorch框架下加载图片做一次模型推理

if __name__ == "__main__": img1 = imread("/home/user/Downloads/112x112/re_bob.jpg") img2 = imread("/home/user/Downloads/112x112/re_jiwi.jpg") img1 = img1 / 255 img2 = img2 / 255 img1 = (img1 - 0.5) / 0.5 img2 = (img2 - 0.5) / 0.5 .

翻译 2021-12-09 09:53:05 · 548 阅读 · 0 评论
基于faiss库的人脸检索加速实验

Faiss是由Facebook于2017年开源的可支撑十亿级别数据检索的高效检索库，是为稠密向量提供高效相似度搜索和聚类的框架，其实现了包括索引搜索、PCA降维、PQ（乘积量化）等多种检索算法参考链接 Faiss流程与原理分析 - yhzhou - 博客园参考链接完全解析：使用Faiss进行海量特征的相似度匹配_夕小瑶的卖萌屋-CSDN博客直接给出实验结果：conda下的py3环境安装faiss方式：pip install faiss-cpu在Intel i7CPU上对329.

原创 2021-12-01 15:56:59 · 836 阅读 · 0 评论
人脸识别评价指标： TAR@FAR

以下解释大白话居多，公式较少，主要是为了理解原理，有不对的地方可以在评论区里讨论。假设检索库1000张人脸，底库10000张人脸，top1正确的人脸有900张，错误的人脸有100张。1. 先说一下我之前的统计人脸识别率的方式输出一个top1的准确率为900/1000=90.00%。2. 以上计算方式的问题因为实际项目上需要一个阈值，而如步骤1的实验是给不出阈值的，而阈值T的给定又决定着在实际项目使用时候的识别率（通过率）和误识率。3. 解释一下TAR@...

原创 2021-11-24 16:12:28 · 5572 阅读 · 4 评论
【人脸识别资源】数据集和开源工程-持续更新

----------------------------------------- 开源工程 ----------------------------------------------------一、FaceX-Zoo：FaceX-Zoo is a PyTorch toolbox for face recognition.https://github.com/JDAI-CV/FaceX-Zoo------------------------------------------ 开源数据

原创 2021-09-08 10:35:48 · 448 阅读 · 0 评论
解决mxnet加载模型非常慢的问题

20210901：先Mark该问题，后续补充解决办法。

原创 2021-09-01 10:17:13 · 424 阅读 · 1 评论
Face Keypoints检测-数据扩充

最近在做人脸关键点检测模型训练，采用的是heatmap方式，使用JD-Landmark 106数据，发现有博主写了一个比较好的数据扩充脚本，Mark一下防止忘记：https://blog.csdn.net/xxboy61/article/details/100181703数据扩充效果：...

原创 2021-08-27 09:56:40 · 147 阅读 · 0 评论
mxnet训练arcface加速实验

本地训练服务器：Ubuntu16.04、cuda10.1、cudnn7.6.5、1080Ti x 8主要是从 https://github.com/deepinsight/insightface/issues/125找的线索。。。环境变量配置（显存）：参考https://blog.csdn.net/u010402786/article/details/78475472使用memonger：参考 https://github.com/dmlc/mxnet-me...

原创 2021-08-26 10:25:23 · 285 阅读 · 0 评论
pytorch保存整个模型和只保存模型参数的语法区别

参考pytorch保存save模型的坑https://blog.csdn.net/weixin_44010756/article/details/115982164

原创 2021-08-18 09:48:25 · 3710 阅读 · 0 评论
numpy生成heatmap的方式

看到一段别人写的用numpy生成热力图的代码，感觉比较简洁，Mark一下：def gaussian_k(x0,y0,sigma, width, height): """ Make a square gaussian kernel centered at (x0, y0) with sigma as SD. """ x = np.arange(0, width, 1, float) ## (width,) y = np.arange(0,

原创 2021-07-29 15:26:02 · 911 阅读 · 0 评论
opencv计算图像模糊度（sobel和laplacian）

# -*-coding=UTF-8-*-"""在无参考图下，检测图片质量的方法"""import osimport cv2import numpy as npfrom skimage import filtersclass BlurDetection: def __init__(self, strDir): print("图片检测对象已经创建...") self.strDir = strDir def _getAllImg(self, .

原创 2021-07-05 20:40:47 · 3197 阅读 · 0 评论
ubuntu18.04虚拟机重启后分辨率降低的问题解决

参考链接VMware中Ubuntu 出现Unknown Display问题解决_xuguokun1986的博客-CSDN博客

原创 2021-06-07 09:16:49 · 1177 阅读 · 0 评论
文字检测DB、PSENet算法介绍

原创 2021-04-02 14:14:55 · 469 阅读 · 0 评论
一个tensorrt的很好的教程-tensorrtx

https://github.com/wang-xinyu/tensorrtx/

原创 2021-04-01 14:08:39 · 1338 阅读 · 0 评论
eccv2020 Can You Read Me Now? Content Aware Rectification using Angle Supervision 文档校正

ECCV2020录用的论文Can You Read Me Now? Content Aware Rectification using Angle Supervision针对移动设备拍摄的文档图像进行几何校正，以获得平整的文档图像。

原创 2021-03-31 15:04:07 · 198 阅读 · 0 评论
用FFmpeg批量处理wav音频文件到指定格式方法

import os # import fnmatch import reimport subprocess gl_file_list = []gl_failed_list = [] def getFilesPath(path): # 获得指定目录中的内容 file_list = os.listdir(path) for file_name in file_list: new_path = os.path.join(path, fil.

原创 2021-02-23 15:06:35 · 557 阅读 · 0 评论
Ubuntu下切换多个版本CUDA的方法

https://blog.csdn.net/ksws0292756/article/details/80120561

原创 2021-02-19 18:40:23 · 90 阅读 · 0 评论
python文本聚类-对一列文本进行聚类

1. 需求一个txt文档，如下图。大概几万行数据，但是没有归类，要人工归类的话耗时耗力，打算用文本聚类的方法对txt里面的每条数据自动分类。2. 参考主要参考https://zhuanlan.zhihu.com/p/782616533. 代码#encoding = utf-8import numpy as npimport pandas as pdimport reimport osimport codecsimport jieba#打开文件，用jieba进行分词

原创 2021-02-05 11:26:56 · 2120 阅读 · 3 评论
opencv读取视频文件，并转成yuv20sp格式，最后赋值给uint8_t*指针

bool MindVideo::DoCapProcess() { string videoFile = "../data/person.mp4"; cv::VideoCapture capture(videoFile); if (!capture.isOpened()) { cout << "Movie open Error" << endl; return FAILED; } cout << "M.

原创 2021-02-03 13:26:37 · 564 阅读 · 0 评论
labelme标注的json文件转成coco128的格式

用Labelme标注的实例分割的label，用于训练实例分割模型，但是后来想用Yolov5训练检测模型，不想重新标注数据，就用实例分割取出外接矩形框，转成coco128的那种格式，用于yolov5的训练。转换代码如下，其中主要是涉及到一些json格式的处理，自己主要是用的是jupyter notebook单步调试的，所以代码格式看起来稍微有点乱。# +#encoding: utf-8# -import jsonimport cv2import base64import osde

原创 2021-01-16 13:33:43 · 1217 阅读 · 1 评论
在ubuntu上安装行为识别环境趟过的坑。。。

要部署centernet行人检测+deepsort多目标跟踪+TSN行为分类1. 安装Opencv3.4.10带contrib版的编译方式按照这个https://blog.csdn.net/wb790238030/article/details/88428850 先更换清华的源，不然下个东西非老鼻子劲了：https://blog.csdn.net/opencv_fjc/article/details/1062091512. 遇到个boostdesc_bgm.i的错误，参考htt...

原创 2020-11-21 10:01:40 · 141 阅读 · 0 评论
拍照反光移除（Reflection removal）方法调研

最近遇到了一个拍照反光的问题：找到了一篇不错的CVPR论文：https://openaccess.thecvf.com/content_cvpr_2017/papers/Sandhan_Anti-Glare_Tightly_Constrained_CVPR_2017_paper.pdf作者没有公布代码，暂时无法实验。进一步的，它里面引用的论文[28]、[31]、[50]，也是不错的思路。...

原创 2020-09-18 13:51:39 · 1005 阅读 · 0 评论
Ubuntu虚拟机上安装配置atlas200dk开发环境-问题记录

1. c++编译器找不到解决办法：在Ubuntu系统上安装gcc编译环境，参考链接https://www.cnblogs.com/soldierback/p/11715446.html。 Done！2. unknown value 'cortex-a73' for -mcpu 这样的error出现了一堆，查看了一下，都是跟deepsort跟踪部分有关系。解决办法：在CMakeList.tx...

原创 2020-07-14 11:44:05 · 566 阅读 · 0 评论
CVPR论文 “Unsupervised learning of probably symmetric deformable 3d objects from images in the wild”学习

3. Method “bilaterally symmetric”如何理解？为解决“never perfectly symmetric”问题，作者采用两种策略：（1）显式地建模asymmetric illumination（解释？）。（2）估计输入图像每个像素的confidence score，这个score描述了该像素有一个对称的counterpart的probability。 3.1 Photo-geometric autoencoding...

原创 2020-06-29 14:32:26 · 1517 阅读 · 0 评论
win10下编译支持VulkanSDK的tencent ncnn

开发前期的测试工作如果都在CPU上进行，一是速度慢，二是太损CPU了！教程链接：how to enable ncnn Vulcan capability。安装步骤：安装VulkanSDK，安装到D盘即可。 cmake-gui进行configure和generate，这一步要将“NCNN_VULKAN”选项勾选，如果找不到关于VULKAN软件的include和lib路径，那手动将其进行配置。用vs2015打开ncnn.sln，分别在debug和release模式下，生成解决方案...

原创 2020-06-17 11:57:28 · 878 阅读 · 0 评论
第一次ncnn在android上的部署教程

主要过程参考：https://blog.csdn.net/qq_33431368/article/details/850097581. android studio在ubuntu上安装配置下载linux版本的IDE：android-studio-ide-193.6514223-linux 将文件解压到/usr/local目录下： tar -zxvf android-studio-ide-193.6514223-linux.tar.gz -C /usr/local...

原创 2020-06-02 17:27:58 · 2861 阅读 · 0 评论
ubuntu16.04下安装编译tencent ncnn

1. 按照以下步骤进行安装配置$ git clone https://github.com/Tencent/ncnn.git$ cd ncnn$ cd build$ cmake -DNCNN_VULKAN=OFF ..$ make -j8$ make install在make -j8这一步骤上报如下错误：是opencv的错误。查了一下自己这边安装的是opencv4,是否会不兼容呢。于是安装Opencv3.4.10.2. 安装配置opencv3.4.10参考教程ubunt.

原创 2020-06-01 11:49:25 · 760 阅读 · 0 评论
ResNeSt算法解析

第一次翻译论文，在Word上编辑的，只能转为图片上传，下次争取直接在富文本编辑器中编辑，对格式支持较好。-----------------------------------------------------------------------------------------------------------------------------------------------------最近泛读了一下ResNeSt论文，因为其中介绍了很多其他的基础网络模型，对于综合理解各种模型有好处，所

原创 2020-05-29 13:17:31 · 2419 阅读 · 5 评论
opencv人像（人脸）美颜、磨皮

#include<opencv2/opencv.hpp>#include<opencv2/imgproc/imgproc.hpp>#include<opencv2/highgui/highgui.hpp>#include<opencv2/objdetect/objdetect.hpp>using namespace std;using namespace cv;void whiteFace(Mat& matSelfPhoto, int .

原创 2020-05-09 15:14:45 · 2094 阅读 · 0 评论

算法学习

作者: dongxia_dl

libopencv_core.so编译不出来

NTU RGB+D 数据集可视化脚本

tiny-yolov3输入图像resize过程解析

np.array和torch.tensor转换

Python引入代码找不到路径的解决办法

本地编译openpose遇到“set_gpu_data“ error

MOT 多目标追踪 自动标注工具调研

格灵深瞳招股书摘要-技术部分

ubuntu18安装labelme后启动不了的问题解决

rgb2gray的c++实现

多CUDA版本切换命令行

pytorch Missing key(s) in state_dict

pytorch框架下加载图片做一次模型推理

基于faiss库的人脸检索加速实验

人脸识别评价指标： TAR@FAR

【人脸识别资源】数据集和开源工程-持续更新

解决mxnet加载模型非常慢的问题

Face Keypoints检测-数据扩充

mxnet训练arcface加速实验

pytorch保存整个模型和只保存模型参数的语法区别

numpy生成heatmap的方式

opencv计算图像模糊度（sobel和laplacian）

ubuntu18.04虚拟机重启后分辨率降低的问题解决

文字检测DB、PSENet算法介绍

一个tensorrt的很好的教程-tensorrtx

eccv2020 Can You Read Me Now? Content Aware Rectification using Angle Supervision 文档校正

用FFmpeg批量处理wav音频文件到指定格式方法

Ubuntu下切换多个版本CUDA的方法

python文本聚类-对一列文本进行聚类

opencv读取视频文件，并转成yuv20sp格式，最后赋值给uint8_t*指针

labelme标注的json文件转成coco128的格式

在ubuntu上安装行为识别环境趟过的坑。。。

拍照反光移除（Reflection removal）方法调研

Ubuntu虚拟机上安装配置atlas200dk开发环境-问题记录

CVPR论文 “Unsupervised learning of probably symmetric deformable 3d objects from images in the wild”学习

win10下编译支持VulkanSDK的tencent ncnn

第一次ncnn在android上的部署教程

ubuntu16.04下安装编译tencent ncnn

ResNeSt算法解析

opencv人像（人脸）美颜、磨皮

MOT 多目标追踪自动标注工具调研