- 博客(49)
- 资源 (78)
- 问答 (1)
- 收藏
- 关注
原创 python 操作.mat文件
在win10中,打开ITC_VD 数据集格式,结果在训练集ITC_VD_Training_Testing_set中,看到标签文件全是快捷方式,选中一个文件,右键 属性,看到:Microsoft Access Table Shortcut (.mat)查了半天,发现是.mat 的 matlab格式,python读取.mat格式:from scipy.io import loadmatm = loadmat(r"E:\data\yolov5_dbb\ITC_VD_Traini
2021-10-31 17:27:46 3183
转载 YOLO-ReT让边缘端也可以实时检测
GitHub - prakharg24/yoloret: Implementation for the paper 'YOLO-ReT: Towards High Accuracy Real-time Object Detection on Edge GPUs'https://github.com/guotao0628/yolorettensorflow-gpu==2.0.0tensorflow_model_optimizationabsl_py在本文中,作者根据现有先...
2021-10-31 01:05:06 2052
转载 Poly-YOLO:更快,更精确的检测(主要解决Yolov3两大问题,附源代码)
论文地址:https://arxiv.org/pdf/2005.13243.pdf源代码:https://gitlab.com/irafm-ai/poly-yolotf keras的:torch版,19年的:https://github.com/baristahell/poly-YOLOv3YOLOv3改进版来了!与YOLOv3相比,Poly-YOLO的训练参数只有其60%,但mAP却提高了40%!并提出更轻量的Poly-YOLO Lite。目标检测是一个过程,其中包含感兴趣..
2021-10-31 00:50:48 1794
原创 分割 bisenetv2笔记
分割bisenetv2笔记2021年的:bisenetv2/bisenetv2_new.py at main · git-luo66/bisenetv2 · GitHub地址2,2019年的:BiseNetv2-pytorch/BiseNet.py at master · Soulempty/BiseNetv2-pytorch · GitHub
2021-10-30 00:20:07 2083
原创 bn层Expected more than 1 value per channel when training, got input size torch.Size
报错代码: File "E:/project/fenge/jacke121-U-2-Net-master_mse/nets/bisnet.py", line 106, in forward feat = self.bn(feat) File "D:\Users\Administrator\miniconda3\lib\site-packages\torch\nn\modules\module.py", line 727, in _call_impl result = self.fo...
2021-10-30 00:07:10 2547
原创 voc格式标签读写操作
image.load(imagePath) imageShape = [image.height(), image.width(), 1 if image.isGrayscale() else 3] writer = PascalVocWriter(imgFolderName, imgFileName, imageShape, localImgP...
2021-10-29 17:22:55 1994
原创 mobilenetv2_unet
这个还稍微靠谱点:import timefrom collections import OrderedDictimport torchimport torch.nn as nnfrom torchvision.models import mobilenet_v2__all__ = ["MobileUnet"]class InvertedResidual(nn.Module): def __init__(self, inp, oup, stride, expand_..
2021-10-29 16:10:58 3334
原创 人脸识别尝试失败欧氏距离
Pytorch损失函数优化的目标是让loss越小越好,如果损失是平方,最小是0,所以优化目标是为0如果人脸识别用欧式距离,正样本距离越小越好,距离的平方即可,负样本这是欧式距离,目标是让距离越大也好,loss只能越小越好,那就距离乘以-1,确实会越来越小,但是loss向负无穷靠近,正样本的loss很小,感觉被淹没忽略了,所以人脸识别用距离损失函数感觉不太合适。...
2021-10-28 17:00:25 2121
原创 RuntimeError: Found dtype Double but expected Float”
RuntimeError: Found dtype Double but expected Float”在求损失函数时报错了,解决方法:target.float()a=np.array([[1,2],[3,4]])b=np.array([[2,3],[4,4]])loss_fn = torch.nn.MSELoss(reduce=True, size_average=True)input = torch.autograd.Variable(torch.from_num
2021-10-27 21:48:56 2946
原创 如何搭建神经网络,神经网络入门必备
如何搭建神经网络,神经网络入门必备!废话少说,第一步,搭建网络,标注好图片注意问题1:data_loader 用pytorch自带的,shuffle为True,shuffle为False会出现不收敛的情况。关于图片数量:如果图片量比较大,先不要上大数据,先用小规模数据,比如200张训练。关于训练:loss如果出现不断下降变小,再测试一下训练集,如果预测准确,说明网络搭建训练环境ok,否则网络搭建训练环境中有错误,先排查错误。然后再加大图片量,继续训练,loss同样需要
2021-10-26 23:25:52 1690
转载 隔空作画,握拳清屏,这个手部跟踪项目火了,在线可玩
在屏幕上隔空作画是近来新兴的一种有趣应用,其中涉及复杂的手部跟踪技术,这类技术成熟之后可用于提升应用程序的交互体验。此前机器之心曾报道过可以隔空写字、绘图的有趣项目「air-drawing」,该项目利用深度学习工具使得用户在配有摄像头的电脑端就可获得自己的手势姿态估计成像图。近日,又一个具有相似功能的开源项目在 reddit 上大火,该项目名为 YoHa——Your Hand Tracking。项目地址:https://github.com/handtracking-io/yoha..
2021-10-26 19:02:58 1734
转载 速度提升2倍,超强悍CPU级骨干网络PP-LCNet
yolov5-pp-lcnet:GitHub - OutBreak-hui/Yolov5-PP-LCNet分类网络的,结果还出来:https://github.com/ngnquan/PP-LCNet分类网络,有精度:https://github.com/frotms/PP-LCNet-Pytorch34m:PPLCNet_x2_5_ssld 0.8082 0.9533 从上图我们可以看出,PP-LCNet 在同样精度的情况下,速度...
2021-10-26 16:24:54 2584 1
原创 micronet 测试2
测试1:micronet 测试_jacke121的专栏-CSDN博客这个精度比较高https://github.com/liyunsheng13/micronetModel #Param MAdds Top-1 download MicroNet-M3 2.6M 21M 62.5 model MicroNet-M2 2.4M 12M 59.4 model MicroNet-M1 1.8M ..
2021-10-22 17:11:32 1554
原创 CoTNet 修改笔记
CoTNet依赖cupy关于cupy的文章:cupy_jacke121的专栏-CSDN博客_cupy调用测试代码:import torchfrom models import cotnet50if __name__ == '__main__': model = cotnet50(num_classes=100) state_dict = torch.load("cotnet50.pth.tar",map_location=torch.device('
2021-10-22 14:32:21 2130
原创 Convolutional-MLPs改造
Convolutional-MLPs人脸识别用,112*112返回7*7特征:调用代码:import torchfrom src import convmlp_sif __name__ == '__main__': model = convmlp_s(num_classes=100) state_dict = torch.load("convmlp_s_imagenet.pth") new_state_dict = {} for k, v in.
2021-10-22 13:56:19 1471
转载 ResNet超强变体:京东AI新开源的计算机视觉模块
论文地址:https://arxiv.org/pdf/2107.12292.pdf源代码地址:https://github.com/JDAI-CV/CoTNet前言具有自注意力的Transformer引发了自然语言处理领域的革命,最近还激发了Transformer式架构设计的出现,并在众多计算机视觉任务中取得了具有竞争力的结果。如下是之前我们分享的基于Transformer的目标检测新技术!链接:利用TRansformer进行端到端的目标检测及跟踪(附源代码)链接:YOLOS
2021-10-22 00:38:36 1594
转载 无卷积骨干网络:金字塔Transformer,提升目标检测/分割等任务精度(附源代码)
论文地址:https://arxiv.org/pdf/2102.12122.pdf源代码地址:https://github.com/whai362/PVT具有自注意力的Transformer引发了自然语言处理领域的革命,最近还激发了Transformer式架构设计的出现,并在众多计算机视觉任务中取得了具有竞争力的结果。如下是之前我们分享的基于Transformer的目标检测新技术!链接:ResNet超强变体:京东AI新开源的计算机视觉模块!(附源代码)链接:利用TRansform..
2021-10-22 00:29:29 1811
转载 pytorch中lstm学习
if __name__ == '__main__': import torch import torch.nn as nn # 神经网络模块 rnn = nn.LSTM(10, 20, 2) # 输入数据x的向量维数10, 设定lstm隐藏层的特征维度20, 此model用2个lstm层。如果是1,可以省略,默认为1) input = torch.randn(5, 3, 10) # 输入的input为,序列长度seq_len=5, 每次...
2021-10-21 23:25:01 1496
原创 文本转图像学习笔记
MirrorGAN可以训练:https://github.com/qiaott/MirrorGANhttps://github.com/Kyfafyd/MirrorGAN分两部分:GLAMSTREAM网络介绍:MirrorGAN的灵感来自于cycleGAN,但是又有两点不同:1)cycleGAN是从图像到图像,而MirrorGAN是从文本到图像。2)cycleGAN输入的两组无关的不同风格图像,而MirrorGAN输入的是一组成对的文本-图像,是一种监督学习。注意
2021-10-21 21:50:03 1554
原创 python tpr fpr
数据分布比较均匀效果可以,数据分布不均匀,两头比较少,效果不好。 labels = read_labels(u"labels.txt") predicts = read_Feautures(u"scores.txt") levels=(1e-6, 1e-5, 1e-4, 1e-3, 1e-2) fpr, tpr, threshold1s=sklearn.metrics.roc_curve(labels,predicts) interp = interpola..
2021-10-20 10:12:01 2510
转载 多分类下的ROC曲线和AUC
本文主要介绍一下多分类下的ROC曲线绘制和AUC计算,并以鸢尾花数据为例,简单用python进行一下说明。如果对ROC和AUC二分类下的概念不是很了解,可以先参考下这篇文章:机器学习之分类器性能指标之ROC曲线、AUC值_MinerYCC-CSDN博客 由于ROC曲线是针对二分类的情况,对于多分类问题,ROC曲线的获取主要有两种方法: 假设测试样本个数为m,类别个数为n(假设类别标签分别为:0,2,...,n-1)。在训练完成后,计算出每个测试样本的在各类别下的概率...
2021-10-19 15:27:08 3112
转载 YOLOv5发布第六个版本,支持一键适配OpenVINO/OpenCV DNN部署
YOLOv5发布了第六个版本,其它我不说,什么是开源精神,不是写个程序扔github就叫开源,而是持续不断改进,精益求精,不断演化版本,增加最有商业价值的功能,YOLOv5做到了。看看最新版本都有哪些新功能让开发者心动....新特性首次发布支持移动端的最小化模型YOLOv5n,只有1.9MB,全称为YOLOv5 Nano。支持模型导出为tensorflow跟keras格式,这是什么鬼,就这招彻底打废原来的tensorflow跟keras版本模仿者!OpenCV DNN支持,原来导出ONNX要支持..
2021-10-19 00:40:48 4844
转载 python 画roc曲线
label.txt:101010feature.txt0.10.20.20.20.20.3代码:# -*- coding: utf-8 -*-import mathimport sklearnimport numpy as npimport matplotlib.pyplot as pltimport skimageimport sklearn.metrics.pairwise as pw#读取标签文件def read_lab..
2021-10-17 23:52:16 5481
原创 tanh relu可视化
# !/usr/bin/python #encoding:utf-8import mathimport matplotlib.pyplot as pltimport numpy as npimport matplotlib as mplimport torchmpl.rcParams['axes.unicode_minus'] = Falsedef sigmoid(x): return 1.0 / (1.0 + np.exp(-x))fig = plt.figure...
2021-10-16 12:40:08 1566
原创 海康sdk 调用c++ python
c++的 unsigned char指针,python格式为:POINTER(c_char)fRealDataCallBack_V30 = REALDATACALLBACK(_fRealDataCallBack_V30)DECCALLBACK = CFUNCTYPE(None, c_long, POINTER(c_char), FRAME_INFO, c_long, c_long)def _fDecCallBack(nPort, pBuf, nSize, pFrameInfo, nR..
2021-10-15 22:06:03 1997 1
原创 海康sdk返回yv12
buffer获取数据: res = bytearray(dwBufSize) rptr = (c_byte * dwBufSize).from_buffer(res)from hkws.core.type_map import *from hkws.model import callbacksNET_DVR_SYSHEAD = 1NET_DVR_STREAMDATA = 2NET_DVR_AUDIOSTRAMDATA = 3NET_DVR_PRIVA
2021-10-15 14:05:59 1429
原创 yuv转bgr
import timefrom ctypes import *import cv2import numpy as npdef yuv2bgr(file_name, height, width, start_frame): fp = open(file_name, 'rb') fp.seek(0, 2) # 设置文件指针到文件流的尾部 + 偏移 0 fp_end = fp.tell() # 获取文件尾指针位置 frame_size = height ...
2021-10-15 10:59:56 2134
转载 python等间隔取样
import numpy as np# 1表示开始位置# 25表示结束位置# 15表示抽取数据个数# int表示转换为整型数据,默认是floatdata=np.linspace(1, 25, 15, dtype=int)print(data)
2021-10-15 00:26:56 3994
原创 yolox使用笔记
github地址:GitHub - Megvii-BaseDetection/YOLOX: YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/megegine安装:pip3 install megen..
2021-10-10 15:09:25 1858
原创 车辆重识别学习笔记
Vehicle Re-IDThe code is modified from our baseline code (https://github.com/layumi/Person_reID_baseline_pytorch)PrerequisiteEfficientNet-Pytorchhttps://github.com/lukemelas/EfficientNet-PyTorchPrepare dataMake a dir and put the AICity2020 d...
2021-10-10 14:00:04 1766
转载 交叉熵损失(Cross-entropy)和平方损失(MSE)究竟有何区别?
一、概念区别1. 均方差损失函数(MSE)简单来说,均方误差(MSE)的含义是求一个batch中n个样本的n个输出与期望输出的差的平方的平均值、2. Cross-entropy(交叉熵损失函数)交叉熵是用来评估当前训练得到的概率分布与真实分布的差异情况。它刻画的是实际输出(概率)与期望输出(概率)的距离,也就是交叉熵的值越小,两个概率分布就越接近。二、为什么不用MSE(两者区别详解)原因 1:交叉熵loss权重更新更快1. MSE比如对于一个神经元(单输入单输出,sigmoi...
2021-10-09 23:30:05 2636
原创 MobileViT 网络测试
实验结果表明,在不同的任务和数据集上,MobileViT显著优于基于CNN和ViT的网络。在ImageNet-1k数据集上,MobileViT在大约600万个参数的情况下达到了78.4%的Top-1准确率,对于相同数量的参数,比MobileNetv3和DeiT的准确率分别高出3.2%和6.2%。在MS-COCO目标检测任务中,在参数数量相近的情况下,MobileViT比MobileNetv3的准确率高5.7%。模型大小:MobileViT s 19mMobileViT xs 9.2...
2021-10-09 17:28:20 2220 3
转载 CVPR 2021 更好的Backbone,伯克利&谷歌提出BoTNet,精度达84.7%
本篇分享论文『Bottleneck Transformers for Visual Recognition』,由 UC Berkeley & Google Research(Transformer一作团队)联合提出BoTNet,ImageNet上精度达84.7%。详细信息如下: 论文链接:https://arxiv.org/abs/2101.11605 项目链接:https://github.com/lucidrains/bottleneck-transfor..
2021-10-09 04:37:52 2078
原创 快速消费品检测
https://github.com/sayan0506/Grocery-Object-Detector-for-FMCG-using-Scaled-YOLOv4-P5
2021-10-08 23:07:25 1629
原创 Yolo-FastestV2 移动端可达300FPS,参数量仅250k
对比Yolo-Fastest:最强轻量级目标检测yolo fastest_jacke121的专栏-CSDN博客精度对比:Network COCO mAP(0.5) Resolution Run Time(4xCore) Run Time(1xCore) FLOPs(G) Params(M) Yolo-FastestV2 24.10 % 352X352 3.29 ms 5.37 ms 0.212 0.25M Yol..
2021-10-08 22:36:32 1950
原创 reid笔记 yolov5 deepsort
方案1:YoloV5 + deepsort + Fast-ReID 完整行人重识别系统(三)_zengwb的博客-CSDN博客改进点:将deepsor的表征提取模型替换成了fastreid训练的reid模型。能够提升跟踪性能。yolov5 + deepsort顺带实现了行人计数功能,统计摄像头内出现过的总人数,以及对穿越自定义黄线行人计数开源地址:https://github.com/zengwb-lx/Yolov5-Deepsort-Fastreid...
2021-10-08 22:27:41 3687
原创 轻量级3D姿态估计
本文分享一款可以跑在手机上的3d姿态估计网络。效果图:算力3.92GFLOPS,而且平均每关节位置误差(MPJPE),也只有大约5厘米。输入是目标检测后的人体图,人体检测用的yolov5。网络结构:编码器-解码器在编码器用于全局特征提取,而解码器进行姿态估计的基础架构,研究团队对其主干网络、激活函数,以及Skip concatenation功能都进行了修改。他们在MobileNetV2的前四个倒置残差块(Residual Block)处修改了通道大小,获得了性能提升。
2021-10-07 22:29:05 2316
原创 Deepsort_V2 2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名
2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名方案初赛:多目标跟踪;指标MOTA和MOTP, 后期的大量实验证明检测算法相对于跟踪更重要。数据集分析:1.人群密集稀疏场景;2.场景(白天,黑夜)3.光照变化丰富。4.多方向视角,方向变化大;5.行人速度有快又慢。ConfigDetection:Cascade-RCNN(HRNet) 基于mmdetection框架。采用多尺度训练(1216,608)和(1024,2048), 多尺度测试:(1216,6..
2021-10-07 22:02:27 1886
转载 python批量下载邮件附件
背景由于同学每周要通过邮箱收数学建模作业,100多人给她发附件,她要一个个地点着下载。太麻烦了,所以想用程序实现下载附件的功能。在网上查资料后,最终实现了稍为简单的下载附件功能,代码有些细节还不是很了解。2019.4.16更新:过几天我也要用邮箱收文件,有了这份代码刚好能用!这再次印证知识不会没用处的,不学才会觉得知识没用呢。2021.01.28更新我又写了一份新的更详细、简洁的代码:python批量处理邮件:poplib和email快速上手教程2021.01.29更新..
2021-10-07 20:01:23 2638 3
转场分割代码封装源代码
2024-09-17
自研人脸关键点,轻量级高精度人脸关键点
2024-08-15
yolov10最新源码版,训练支持labelme标注
2024-06-14
pyqt opengl 3d渲染源码 正交投影,透视投影
2024-06-12
rk3588 麒麟系统硬解码 硬编码源代码
2024-06-08
qt c++ http-server 多线程源代码
2024-06-07
网络流量异常检测系统源代码
2024-06-01
麒麟3588系统语音播报源代码
2024-05-30
自研扩散模型高光谱修复网络
2024-05-18
bvh最新播放器 python源代码
2024-05-13
BIWI vocaset模板
2024-04-25
rknn yolov5 rtsp
2024-04-21
问财选股导出excel pythony源代码
2024-04-21
自研lstm多目标跟踪,DanceTrack验证集精度98%
2024-04-18
强大好用的人体关键点标注工具
2024-04-18
pyopengl windows x64 whl安装包
2024-02-17
mmpose 预测转json标注
2024-01-25
3d-nms cuda代码
2024-01-07
MobileViT v3 pytorch代码
2023-12-31
OpenPCDet ingroup-inds库 windows编译
2023-12-27
Ultra-Fast-Lane-Detection-v2 pytorch版
2023-10-20
insightface/alignment 人脸关键点的pytorch版本
2023-04-29
yolov5 face onnx推理代码
2023-03-26
yolov7 分割 tensorrt 推理源代码
2023-02-23
labelme-5.1.1
2023-01-27
3DDFA-V2.5-opencv-yolov5face
2022-12-25
tensorrt c++ 推理项目
2022-07-03
yolov5各个版本 tensorrt cfg文件
2022-02-16
coco2017转xml格式,精选人体数据集
2022-01-13
神经网络改进的几个思考
2022-04-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人