2021年10月_AI算法网奇

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 python 操作.mat文件

在win10中，打开ITC_VD 数据集格式，结果在训练集ITC_VD_Training_Testing_set中，看到标签文件全是快捷方式，选中一个文件，右键属性，看到：Microsoft Access Table Shortcut (.mat)查了半天，发现是.mat 的 matlab格式，python读取.mat格式：from scipy.io import loadmatm = loadmat(r"E:\data\yolov5_dbb\ITC_VD_Traini

2021-10-31 17:27:46 3183

转载 YOLO-ReT让边缘端也可以实时检测

GitHub - prakharg24/yoloret: Implementation for the paper 'YOLO-ReT: Towards High Accuracy Real-time Object Detection on Edge GPUs'https://github.com/guotao0628/yolorettensorflow-gpu==2.0.0tensorflow_model_optimizationabsl_py在本文中，作者根据现有先...

2021-10-31 01:05:06 2052

转载 Poly-YOLO：更快，更精确的检测（主要解决Yolov3两大问题，附源代码）

论文地址：https://arxiv.org/pdf/2005.13243.pdf源代码：https://gitlab.com/irafm-ai/poly-yolotf keras的：torch版，19年的：https://github.com/baristahell/poly-YOLOv3YOLOv3改进版来了！与YOLOv3相比，Poly-YOLO的训练参数只有其60％，但mAP却提高了40％！并提出更轻量的Poly-YOLO Lite。目标检测是一个过程，其中包含感兴趣..

2021-10-31 00:50:48 1794

原创分割 bisenetv2笔记

分割bisenetv2笔记2021年的：bisenetv2/bisenetv2_new.py at main · git-luo66/bisenetv2 · GitHub地址2，2019年的：BiseNetv2-pytorch/BiseNet.py at master · Soulempty/BiseNetv2-pytorch · GitHub

2021-10-30 00:20:07 2083

原创 bn层Expected more than 1 value per channel when training, got input size torch.Size

报错代码： File "E:/project/fenge/jacke121-U-2-Net-master_mse/nets/bisnet.py", line 106, in forward feat = self.bn(feat) File "D:\Users\Administrator\miniconda3\lib\site-packages\torch\nn\modules\module.py", line 727, in _call_impl result = self.fo...

2021-10-30 00:07:10 2547

原创 voc格式标签读写操作

image.load(imagePath) imageShape = [image.height(), image.width(), 1 if image.isGrayscale() else 3] writer = PascalVocWriter(imgFolderName, imgFileName, imageShape, localImgP...

2021-10-29 17:22:55 1994

原创 mobilenetv2_unet

这个还稍微靠谱点：import timefrom collections import OrderedDictimport torchimport torch.nn as nnfrom torchvision.models import mobilenet_v2__all__ = ["MobileUnet"]class InvertedResidual(nn.Module): def __init__(self, inp, oup, stride, expand_..

2021-10-29 16:10:58 3334

原创人脸识别尝试失败欧氏距离

Pytorch损失函数优化的目标是让loss越小越好，如果损失是平方，最小是0，所以优化目标是为0如果人脸识别用欧式距离，正样本距离越小越好，距离的平方即可，负样本这是欧式距离，目标是让距离越大也好，loss只能越小越好，那就距离乘以-1，确实会越来越小，但是loss向负无穷靠近，正样本的loss很小，感觉被淹没忽略了，所以人脸识别用距离损失函数感觉不太合适。...

2021-10-28 17:00:25 2121

原创 RuntimeError: Found dtype Double but expected Float”

RuntimeError: Found dtype Double but expected Float”在求损失函数时报错了，解决方法：target.float()a=np.array([[1,2],[3,4]])b=np.array([[2,3],[4,4]])loss_fn = torch.nn.MSELoss(reduce=True, size_average=True)input = torch.autograd.Variable(torch.from_num

2021-10-27 21:48:56 2946

原创 cnn旋转角度判断回归

图像旋转网络

2021-10-27 00:31:15 1969

原创如何搭建神经网络，神经网络入门必备

如何搭建神经网络，神经网络入门必备!废话少说，第一步，搭建网络，标注好图片注意问题1：data_loader 用pytorch自带的，shuffle为True，shuffle为False会出现不收敛的情况。关于图片数量：如果图片量比较大，先不要上大数据，先用小规模数据，比如200张训练。关于训练：loss如果出现不断下降变小，再测试一下训练集，如果预测准确，说明网络搭建训练环境ok，否则网络搭建训练环境中有错误，先排查错误。然后再加大图片量，继续训练，loss同样需要

2021-10-26 23:25:52 1690

转载隔空作画，握拳清屏，这个手部跟踪项目火了，在线可玩

在屏幕上隔空作画是近来新兴的一种有趣应用，其中涉及复杂的手部跟踪技术，这类技术成熟之后可用于提升应用程序的交互体验。此前机器之心曾报道过可以隔空写字、绘图的有趣项目「air-drawing」，该项目利用深度学习工具使得用户在配有摄像头的电脑端就可获得自己的手势姿态估计成像图。近日，又一个具有相似功能的开源项目在 reddit 上大火，该项目名为 YoHa——Your Hand Tracking。项目地址：https://github.com/handtracking-io/yoha..

2021-10-26 19:02:58 1734

转载速度提升2倍，超强悍CPU级骨干网络PP-LCNet

yolov5-pp-lcnet：GitHub - OutBreak-hui/Yolov5-PP-LCNet分类网络的，结果还出来：https://github.com/ngnquan/PP-LCNet分类网络，有精度：https://github.com/frotms/PP-LCNet-Pytorch34m：PPLCNet_x2_5_ssld 0.8082 0.9533 从上图我们可以看出，PP-LCNet 在同样精度的情况下，速度...

2021-10-26 16:24:54 2584 1

原创 micronet 测试2

测试1：micronet 测试_jacke121的专栏-CSDN博客这个精度比较高https://github.com/liyunsheng13/micronetModel #Param MAdds Top-1 download MicroNet-M3 2.6M 21M 62.5 model MicroNet-M2 2.4M 12M 59.4 model MicroNet-M1 1.8M ..

2021-10-22 17:11:32 1554

原创 CoTNet 修改笔记

CoTNet依赖cupy关于cupy的文章：cupy_jacke121的专栏-CSDN博客_cupy调用测试代码：import torchfrom models import cotnet50if __name__ == '__main__': model = cotnet50(num_classes=100) state_dict = torch.load("cotnet50.pth.tar",map_location=torch.device('

2021-10-22 14:32:21 2130

原创 Convolutional-MLPs改造

Convolutional-MLPs人脸识别用，112*112返回7*7特征：调用代码：import torchfrom src import convmlp_sif __name__ == '__main__': model = convmlp_s(num_classes=100) state_dict = torch.load("convmlp_s_imagenet.pth") new_state_dict = {} for k, v in.

2021-10-22 13:56:19 1471

转载 ResNet超强变体：京东AI新开源的计算机视觉模块

论文地址：https://arxiv.org/pdf/2107.12292.pdf源代码地址：https://github.com/JDAI-CV/CoTNet前言具有自注意力的Transformer引发了自然语言处理领域的革命，最近还激发了Transformer式架构设计的出现，并在众多计算机视觉任务中取得了具有竞争力的结果。如下是之前我们分享的基于Transformer的目标检测新技术！链接：利用TRansformer进行端到端的目标检测及跟踪（附源代码）链接：YOLOS

2021-10-22 00:38:36 1594

转载无卷积骨干网络：金字塔Transformer，提升目标检测/分割等任务精度（附源代码）

论文地址：https://arxiv.org/pdf/2102.12122.pdf源代码地址：https://github.com/whai362/PVT具有自注意力的Transformer引发了自然语言处理领域的革命，最近还激发了Transformer式架构设计的出现，并在众多计算机视觉任务中取得了具有竞争力的结果。如下是之前我们分享的基于Transformer的目标检测新技术！链接：ResNet超强变体：京东AI新开源的计算机视觉模块！（附源代码）链接：利用TRansform..

2021-10-22 00:29:29 1811

转载 pytorch中lstm学习

if __name__ == '__main__': import torch import torch.nn as nn # 神经网络模块 rnn = nn.LSTM(10, 20, 2) # 输入数据x的向量维数10, 设定lstm隐藏层的特征维度20, 此model用2个lstm层。如果是1，可以省略，默认为1) input = torch.randn(5, 3, 10) # 输入的input为，序列长度seq_len=5, 每次...

2021-10-21 23:25:01 1496

原创文本转图像学习笔记

MirrorGAN可以训练：https://github.com/qiaott/MirrorGANhttps://github.com/Kyfafyd/MirrorGAN分两部分：GLAMSTREAM网络介绍：MirrorGAN的灵感来自于cycleGAN，但是又有两点不同：1）cycleGAN是从图像到图像，而MirrorGAN是从文本到图像。2）cycleGAN输入的两组无关的不同风格图像，而MirrorGAN输入的是一组成对的文本-图像，是一种监督学习。注意

2021-10-21 21:50:03 1554

原创 python tpr fpr

数据分布比较均匀效果可以，数据分布不均匀，两头比较少，效果不好。 labels = read_labels(u"labels.txt") predicts = read_Feautures(u"scores.txt") levels=(1e-6, 1e-5, 1e-4, 1e-3, 1e-2) fpr, tpr, threshold1s=sklearn.metrics.roc_curve(labels,predicts) interp = interpola..

2021-10-20 10:12:01 2510

转载多分类下的ROC曲线和AUC

本文主要介绍一下多分类下的ROC曲线绘制和AUC计算，并以鸢尾花数据为例，简单用python进行一下说明。如果对ROC和AUC二分类下的概念不是很了解，可以先参考下这篇文章：机器学习之分类器性能指标之ROC曲线、AUC值_MinerYCC-CSDN博客由于ROC曲线是针对二分类的情况，对于多分类问题，ROC曲线的获取主要有两种方法：假设测试样本个数为m，类别个数为n（假设类别标签分别为：0，2，...，n-1）。在训练完成后，计算出每个测试样本的在各类别下的概率...

2021-10-19 15:27:08 3112

转载 YOLOv5发布第六个版本，支持一键适配OpenVINO/OpenCV DNN部署

YOLOv5发布了第六个版本，其它我不说，什么是开源精神，不是写个程序扔github就叫开源，而是持续不断改进，精益求精，不断演化版本，增加最有商业价值的功能，YOLOv5做到了。看看最新版本都有哪些新功能让开发者心动....新特性首次发布支持移动端的最小化模型YOLOv5n，只有1.9MB，全称为YOLOv5 Nano。支持模型导出为tensorflow跟keras格式，这是什么鬼，就这招彻底打废原来的tensorflow跟keras版本模仿者！OpenCV DNN支持，原来导出ONNX要支持..

2021-10-19 00:40:48 4844

转载 python 画roc曲线

label.txt:101010feature.txt0.10.20.20.20.20.3代码：# -*- coding: utf-8 -*-import mathimport sklearnimport numpy as npimport matplotlib.pyplot as pltimport skimageimport sklearn.metrics.pairwise as pw#读取标签文件def read_lab..

2021-10-17 23:52:16 5481

原创 tanh relu可视化

# !/usr/bin/python #encoding:utf-8import mathimport matplotlib.pyplot as pltimport numpy as npimport matplotlib as mplimport torchmpl.rcParams['axes.unicode_minus'] = Falsedef sigmoid(x): return 1.0 / (1.0 + np.exp(-x))fig = plt.figure...

2021-10-16 12:40:08 1566

原创海康sdk 调用c++ python

c++的 unsigned char指针，python格式为：POINTER(c_char)fRealDataCallBack_V30 = REALDATACALLBACK(_fRealDataCallBack_V30)DECCALLBACK = CFUNCTYPE(None, c_long, POINTER(c_char), FRAME_INFO, c_long, c_long)def _fDecCallBack(nPort, pBuf, nSize, pFrameInfo, nR..

2021-10-15 22:06:03 1997 1

原创海康sdk返回yv12

buffer获取数据： res = bytearray(dwBufSize) rptr = (c_byte * dwBufSize).from_buffer(res)from hkws.core.type_map import *from hkws.model import callbacksNET_DVR_SYSHEAD = 1NET_DVR_STREAMDATA = 2NET_DVR_AUDIOSTRAMDATA = 3NET_DVR_PRIVA

2021-10-15 14:05:59 1429

原创 yuv转bgr

import timefrom ctypes import *import cv2import numpy as npdef yuv2bgr(file_name, height, width, start_frame): fp = open(file_name, 'rb') fp.seek(0, 2) # 设置文件指针到文件流的尾部 + 偏移 0 fp_end = fp.tell() # 获取文件尾指针位置 frame_size = height ...

2021-10-15 10:59:56 2134

转载 python等间隔取样

import numpy as np# 1表示开始位置# 25表示结束位置# 15表示抽取数据个数# int表示转换为整型数据，默认是floatdata=np.linspace(1, 25, 15, dtype=int)print(data)

2021-10-15 00:26:56 3994

原创 yolox使用笔记

github地址：GitHub - Megvii-BaseDetection/YOLOX: YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/megegine安装：pip3 install megen..

2021-10-10 15:09:25 1858

原创车辆重识别学习笔记

Vehicle Re-IDThe code is modified from our baseline code (https://github.com/layumi/Person_reID_baseline_pytorch)PrerequisiteEfficientNet-Pytorchhttps://github.com/lukemelas/EfficientNet-PyTorchPrepare dataMake a dir and put the AICity2020 d...

2021-10-10 14:00:04 1766

转载交叉熵损失(Cross-entropy)和平方损失(MSE)究竟有何区别？

一、概念区别1. 均方差损失函数（MSE）简单来说，均方误差（MSE）的含义是求一个batch中n个样本的n个输出与期望输出的差的平方的平均值、2. Cross-entropy（交叉熵损失函数)交叉熵是用来评估当前训练得到的概率分布与真实分布的差异情况。它刻画的是实际输出（概率）与期望输出（概率）的距离，也就是交叉熵的值越小，两个概率分布就越接近。二、为什么不用MSE（两者区别详解）原因 1：交叉熵loss权重更新更快1. MSE比如对于一个神经元（单输入单输出，sigmoi...

2021-10-09 23:30:05 2636

原创 MobileViT 网络测试

实验结果表明，在不同的任务和数据集上，MobileViT显著优于基于CNN和ViT的网络。在ImageNet-1k数据集上，MobileViT在大约600万个参数的情况下达到了78.4%的Top-1准确率，对于相同数量的参数，比MobileNetv3和DeiT的准确率分别高出3.2%和6.2%。在MS-COCO目标检测任务中，在参数数量相近的情况下，MobileViT比MobileNetv3的准确率高5.7%。模型大小：MobileViT s 19mMobileViT xs 9.2...

2021-10-09 17:28:20 2220 3

转载 CVPR 2021 更好的Backbone，伯克利&谷歌提出BoTNet，精度达84.7%

本篇分享论文『Bottleneck Transformers for Visual Recognition』，由 UC Berkeley & Google Research(Transformer一作团队)联合提出BoTNet，ImageNet上精度达84.7%。详细信息如下：论文链接：https://arxiv.org/abs/2101.11605 项目链接：https://github.com/lucidrains/bottleneck-transfor..

2021-10-09 04:37:52 2078

原创快速消费品检测

https://github.com/sayan0506/Grocery-Object-Detector-for-FMCG-using-Scaled-YOLOv4-P5

2021-10-08 23:07:25 1629

原创 Yolo-FastestV2 移动端可达300FPS，参数量仅250k

对比Yolo-Fastest：最强轻量级目标检测yolo fastest_jacke121的专栏-CSDN博客精度对比：Network COCO mAP(0.5) Resolution Run Time(4xCore) Run Time(1xCore) FLOPs(G) Params(M) Yolo-FastestV2 24.10 % 352X352 3.29 ms 5.37 ms 0.212 0.25M Yol..

2021-10-08 22:36:32 1950

原创 reid笔记 yolov5 deepsort

方案1：YoloV5 + deepsort + Fast-ReID 完整行人重识别系统（三）_zengwb的博客-CSDN博客改进点：将deepsor的表征提取模型替换成了fastreid训练的reid模型。能够提升跟踪性能。yolov5 + deepsort顺带实现了行人计数功能，统计摄像头内出现过的总人数，以及对穿越自定义黄线行人计数开源地址：https://github.com/zengwb-lx/Yolov5-Deepsort-Fastreid...

2021-10-08 22:27:41 3687

原创轻量级3D姿态估计

本文分享一款可以跑在手机上的3d姿态估计网络。效果图：算力3.92GFLOPS，而且平均每关节位置误差（MPJPE），也只有大约5厘米。输入是目标检测后的人体图，人体检测用的yolov5。网络结构：编码器-解码器在编码器用于全局特征提取，而解码器进行姿态估计的基础架构，研究团队对其主干网络、激活函数，以及Skip concatenation功能都进行了修改。他们在MobileNetV2的前四个倒置残差块（Residual Block）处修改了通道大小，获得了性能提升。

2021-10-07 22:29:05 2316

原创 Deepsort_V2 2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名

2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名方案初赛：多目标跟踪；指标MOTA和MOTP, 后期的大量实验证明检测算法相对于跟踪更重要。数据集分析：1.人群密集稀疏场景；2.场景（白天，黑夜）3.光照变化丰富。4.多方向视角，方向变化大；5.行人速度有快又慢。ConfigDetection：Cascade-RCNN(HRNet) 基于mmdetection框架。采用多尺度训练（1216,608）和（1024,2048）, 多尺度测试：（1216,6..

2021-10-07 22:02:27 1886

转载 python批量下载邮件附件

背景由于同学每周要通过邮箱收数学建模作业，100多人给她发附件，她要一个个地点着下载。太麻烦了，所以想用程序实现下载附件的功能。在网上查资料后，最终实现了稍为简单的下载附件功能，代码有些细节还不是很了解。2019.4.16更新：过几天我也要用邮箱收文件，有了这份代码刚好能用！这再次印证知识不会没用处的，不学才会觉得知识没用呢。2021.01.28更新我又写了一份新的更详细、简洁的代码：python批量处理邮件：poplib和email快速上手教程2021.01.29更新..

2021-10-07 20:01:23 2638 3

转场分割代码封装源代码

本算法根据TransNetV2-SBD 做了代码封装，可以直接用来进行转场判断，也支持直接把mp4视频根据转场分割平台是基于TensorFlow的，执行入口transnetv2_demo.py TensorFlow gpu和cpu都支持： tensorflow 2.12.0 tensorflow-estimator 2.12.0 tensorflow-gpu 2.8.0 tensorflow-intel 2.12.0 tensorflow-io-gcs-filesystem 0.31.0 termcolor 2.3.0

2024-09-17

opencv 中文字体库

2024-09-17

自研人脸关键点，轻量级高精度人脸关键点

自研人脸关键点，轻量级高精度人脸关键点98个点，模型大小700多kb 低头，抬头，侧脸，都可准确识别，可以转ncnn，mnn在手机上cpu到3毫秒以内带人脸跟踪算法；包含训练代码： train_lbg_box_new.py 推理代码 demo_v5_face.py 人脸检测、人脸关键点综合示例代码； demo_v5_nopad_last.py yolov5 face onnx转ncnn代码： Peppa-Facial-Landmark-kuoda\deploy\onnx_2_ncnn_yolov5.py 人脸关键点onnx转ncnn： onnx_2_ncnn_mark.py

2024-08-15

yolov10最新源码版，训练支持labelme标注

yolov10最新源码版，原版只支持标注格式为txt格式，笔者以前训练yolo用labelme的json格式标注，统一格式，数据管理，可视化，查badcase更方便。修改了数据格式，增加支持labelmejson独立格式标注标注样例： { "version": "5.3.1", "flags": {}, "shapes": [ { "label": "dao", "points": [ [ 1990.9259259259259, 322.3395061728395 ], [ 53.75, 689.5000000000001 ] 预测发现还是会有重叠框，加上nms过滤重叠框，效果会更好本预测代码已经加上nms机制

2024-06-14

pyqt opengl 3d渲染源码正交投影，透视投影

pyqt opengl 3d渲染源码支持格式，3d画线，立方体（也可以进行扩展二次开发），可以旋转，平移，缩放支持鼠标点选提示，鼠标和立方体交点3d坐标，代码经过反复优化，测试，效果比较稳定。最新代码： widget_opengl_change1.py 通过圆柱组合形成立方体，支持正交投影，透视投影无缝切换，左下角显示3d坐标。其他代码也有学习和参考价值

2024-06-12

rk3588 麒麟系统硬解码硬编码源代码

rk3588 麒麟系统硬解码h264 硬编码264源代码 qt c++ 项目，亲测成功项目带有librockchip-mpp安装文件， librockchip-mpp-dev_1.5.0-1rk4_arm64.deb 安装rockchip-mpp deb sudo dpkg -i librockchip-mpp-dev_1.5.0-1rk4_arm64.deb 使用终端命令和apt工具：打开终端，使用以下命令安装deb文件并解决依赖关系： sudo apt install ./librockchip-mpp-dev_1.5.0-1rk4_arm64.deb 需要提前安装ffmpeg库，main.cpp中有回调函数，mpp_decoder_frame_callback，用来接收解码后的frame，经过测试，效率挺高的，可以达到30帧以内。

2024-06-08

qt c++ http-server 多线程源代码

qt c++ 实现 http_server 在子线程启动，收到消息后，更新主线程的ui显示，不卡顿本人亲测成功，希望给大家提供便利。跨平台的，Windows，linux，arm，麒麟系统都能用

2024-06-07

网络流量异常检测系统源代码

网络流量异常检测系统基于Network-anomaly-detection-with-deep-learning-along-with-UI 做的改进改进1 抓包工具更新 Npcap下载： https://npcap.com/#download 改进2，原来代码用了多线程，在Windows系统运行会导致死机，本次针对死机做了改进改进2，源代码对pandas 的dataframe操作导致频繁报警，改进之后频繁报警没有了。

2024-06-01

麒麟3588系统语音播报源代码

麒麟3588系统语音播报源代码麒麟arm系统qt c++文本生成播报系统源代码可以定制播报人性别，多款播报人可供选择，支持中英文，c++ qt示例源代码，亲测成功。 QListWidget 自定义样式，解决QPixmap不能读取图片的问题。

2024-05-30

qt c++ sqlite 封装

2024-05-27

自研扩散模型高光谱修复网络

自研扩散模型高光谱修复网络基于MST_Plus_Plus 网络改造。试验数据扩散模型loss初步测试降到了0.005，比不加扩散loss小了20倍，训练入口 train_cos_img.py

2024-05-18

bvh最新播放器 python源代码

bvh最新播放器可以显示骨骼名称，旋转角度，自适应大小，支持3维npz数据可视化 python实现，提供源代码，修改和完善很方便。根据3维npz生成bvh bvh最新播放器 python源代码详细介绍： https://blog.csdn.net/jacke121/article/details/138809268

2024-05-13

rknn 麒麟系统adb驱动安装

2024-04-28

BIWI vocaset模板

BIWI vocaset模板包括FLAME_sample.ply FLAME_masks.pkl BIWI/templates.pkl BIWI/F1.obj BIWI.ply

2024-04-25

rknn yolov5 rtsp

rknn yolov5的官方网站 https://github.com/airockchip/rknn-toolkit2 里面有rk3588 yolov5的推理示例程序，也包括Android推理实例程序，但是Android平台不支持rstp实时推理本项目用ffmpeg拉流，mpp硬解码，然后rknn yolov5推理跑通，调用代码在MainActivity，识别结果mpp硬编码保存为264视频文件。本项目也支持264裸流视频文件推理。

2024-04-21

问财选股导出excel pythony源代码

python问财选股导出excel功能开发，导出csv格式，带界面，也可以基于这个做二次开发或者改进依赖项pandas，pyqt5

2024-04-21

自研lstm多目标跟踪，DanceTrack验证集精度98%

多目标跟踪这几年一直是算法难题，用过传统跟踪算法，fairmot、bytetrack，效果不是特别理想，自己思考研究了一种基于lstm和多头注意力机制的多目标跟踪算法，支持gru，tcn，TimeSeriesTransformer，lstm和多头注意力机制效果最好，在DanceTrack数据集验证集精度99%，其他算法精度也在98以上， 1060显卡每帧平均推理速度2ms。本算法是多目标跟踪算法，算法不含检测，检测算法可以用任意检测算法对接。生成训练数据： get_track_data_new.py 可视化数据标签： data/view_track.py 训练入口： train_cos_lstm.py 可视化测试入口： demo_track.py 测试准确率： demo_track_cls.py 本算法算是在多目标跟踪算法的一种思考，抛转引玉，欢迎有志之士一起交流分享。

2024-04-18

强大好用的人体关键点标注工具

之前想研发一款好的人体关键点识别算法，发现网上竟然没有一款好用的人体关键点标注工具，labelme标注时各个关节点是断开的，不能联动，然后自己就开发了一款人体关键点标注工具，关节点直接可以联动，还有关节点放大特效，方便标注。实际效果演示网址： https://www.bilibili.com/video/BV18A4m1G73y/?vd_source=2cd2b3646627adc5dc5f2bf8b7fac8fd https://blog.csdn.net/jacke121/article/details/135849963

2024-04-18

pyopengl windows x64 whl安装包

pyopengl windows x64 whl安装包本资源提供了python3.9和3.10版本，x64位安装包。官方的下载地址已经失效 http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyopengl

2024-02-17

mmpose 预测转json标注

mmpose 预测的2d点转成json文件，方便labelme标注背景：mmpose或者其他2d关键点，bad case标注是个难题，这个脚本可以把mmpose预测的关键点，转为json文件，方便进行二次标注或修改。

2024-01-25

3d-nms cuda代码

3d_nms c++代码和 cuda cu代码，win11编译成功,linux也可以用 python setup.py build python setup.py install

2024-01-07

MobileViT v3 pytorch代码

MobileViT v3 pytorch代码，几乎都不能加载官方的预训练模型，本人经过调整修改，可以加载官方预训练模型，原创不易，希望多多支持

2023-12-31

OpenPCDet ingroup-inds库 windows编译

OpenPCDet ingroup_inds库 windows编译原版是linux代码，在Windows上编译失败，本人经过修改，可以编译成功。

2023-12-27

Ultra-Fast-Lane-Detection-v2 pytorch版

Ultra-Fast-Lane-Detection-v2 pytorch版 Ultra-Fast-Lane-Detection-v2官方原版数据加载用的nvidia.dali.pipeline Windows没有nvidia库，所以无法训练，数据增强也不方便，特地实现了pytorch的dataset版，可以训练，推理预测训练收敛更快可以在这个基础上改进，很方便。

2023-10-20

insightface/alignment 人脸关键点的pytorch版本

landmark 106个点，很强大的算法，算法介绍； https://blog.csdn.net/jacke121/article/details/116605765 模型4.8m， gpu测试13ms左右，分辨率192*192 入口代码： demo_v5_face.py 学习研究比较合适

2023-04-29

yolov5 face onnx推理代码

yolov5 face onnx推理，支持原版yolov5 face 导出的onnx，亲测成功支持yolov5 face m模型，也支持yolov5 blazeface 。

2023-03-26

yolov7 分割 tensorrt 推理源代码

yolov7 mask分割 tensorrt 推理源代码，网上没有人实现，和大佬一起熬了好几个通宵研发出来，支持tensorrt8，win10平台，亲测成功，可运行 linux也支持，可自行跨平台适配。

2023-02-23

labelme-5.1.1

labelme-5.1.1，设置了自动保存，标签不保存图片，自定义标签颜色，亲测成功，博客地址： https://blog.csdn.net/jacke121/article/details/112288397

2023-01-27

3DDFA-V2.5-opencv-yolov5face

3DDFA_V2.5原本人脸检测器是facebox， facebox在脸部超过一半被遮挡时效果较差，人脸检测器换成yolov5-face，yolov5-face在脸遮挡超过一半时关键点不太准确。图片处理是imageio，换成opencv。 demo_cam_v5face.py yolov5-face 依赖项： models，加载模型用 yolov5_face，人脸检测器。

2022-12-25

yolov7训练 json标注格式代码

yolov7训练只支持txt格式，自己添加了json标注格式解析和支持。

2022-10-06

yolov7_mask_ncnn win10版

yolov7 mask ncnn c++ win10版，亲测成功。

2022-09-30

tensorrt c++ 推理项目

tensorrt c++ 推理示例项目，支持分类网络，比如alexnet，mobileone,skipnet等轻量级网络。环境：win10 vs2017环境，cuda11.0，亲测成功。 tensorrt库版本： TensorRT-8.2.1.8.Windows10.x86_64.cuda-11.4.cudnn8.2 转换流程：pytorch转onnx，onnx转tensorrt引擎 python生成tensorrt引擎步骤，可以查看我的博客： https://blog.csdn.net/jacke121/article/details/125382721

2022-07-03

神经网络改进的几个思考

2022-04-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人