![](https://img-blog.csdnimg.cn/62d16b222a91403cbd32a3d1e8cdfe63.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
深度学习
文章平均质量分 60
CNN
DLANDML
分享一些正在做的项目
目前正在学习机器学习和深度学习相关知识
目前是一名算法工程师
展开
-
SSD详细解答
1、RPN网络结构 https://www.cnblogs.com/Terrypython/p/10584384.html2、SSD网络结构:详细解答https://blog.csdn.net/xiaohu2022/article/details/79833786原创 2021-02-27 10:33:35 · 110928 阅读 · 0 评论 -
Imagenet数据集1000类别中英文
英文{0: 'tench, Tinca tinca', 1: 'goldfish, Carassius auratus', 2: 'great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias', 3: 'tiger shark, Galeocerdo cuvieri', 4: 'hammerhead, hammerhead shark', 5: 'electric ray, cram.原创 2022-03-07 20:27:47 · 1180 阅读 · 0 评论 -
目标检测(降低误检测率及小目标检测系列笔记)
深度学习中,为了提高模型的精度和泛化能力,往往着眼于两个方面:(1)使用更多的数据(2)使用更深更复杂的网络。**一、什么是负样本**负样本是指不包含任务所要识别的目标的图像,也叫负图像(Negtive Image)。以识别限速牌为例,如下所示,左图包含限速牌,为正样本,右图不包含限速牌,为背景图,即负样本。正样本负样本2.为什么要训练负样本训练负样本的目的是为了降低误检测率、误识别率,提高网络模型的泛化能力。通俗地讲就是告诉检测器,这些“不是你要检测的目标”。3.F原创 2021-11-25 14:13:41 · 86602 阅读 · 3 评论 -
Fall detection for elderly people using the variation of key points of human skeleton
ABSTRACT In the area of health care, fall is a dangerous problem for aged persons. Sometimes, they are a serious cause of death. On the other hand, the number of aged persons will increase in the future. Therefore,it is necessary to develop an accurate sys原创 2021-04-26 21:01:39 · 126922 阅读 · 0 评论 -
faster-rcnn比较好的资料
https://zhuanlan.zhihu.com/p/31426458https://www.pianshen.com/article/5063756069/https://www.jianshu.com/p/22c50ded4cf7?from=groupmessagehttps://blog.csdn.net/u014380165/article/details/80303812原创 2021-04-21 14:53:34 · 126751 阅读 · 0 评论 -
Math.round(),Math.ceil(),Math.floor()的区别
Math.round(),Math.ceil(),Math.floor()的区别1.Math.round():根据“round”的字面意思“附近、周围”,可以猜测该函数是求一个附近的整数,看下面几个例子就明白。小数点后第一位<5正数:Math.round(11.46)=11负数:Math.round(-11.46)=-11小数点后第一位>5正数:Math.round(11.68)=12负数:Math.round(-11.68)=-12小数点后第一位=5..原创 2021-04-21 14:49:53 · 126061 阅读 · 0 评论 -
调参秘籍:BN层详解
批量归一化(BN:Batch Normalization:解决在训练过程中,中间层数据分布发生改变的问题,以防止梯度消失或爆炸、加快训练速度)1、为什么输入数据需要归一化(Normalized Data)?归一化后有什么好处呢?原因在于神经网络学习过程本质就是为了学习数据分布,一旦训练数据与测试数据的分布不同,那么网络的泛化能力也大大降低;另外一方面,一旦每批训练数据的分布各不相同(batch 梯度下降),那么网络就要在每次迭代都去学习适应不同的分布,这样将会大大降低网络的训练速度,...原创 2021-04-12 21:11:26 · 127748 阅读 · 2 评论 -
目标检测基础模块之IoU汇总(iou/giou/ciou/diou)
1 简介IoU又名交并比,是一种计算不同图像相互重叠比例的算法,时常被用于深度学习领域的目标检测或语义分割任务中。1.1 IoU在目标检测中的应用在目标检测任务中,我们时常会让模型一次性生成大量的候选框(candidate bound),然后再根据每一个框的置信度对框进行排序,进而依次计算框与框之间的IoU,以非极大值抑制的方式,来判断到底哪一个是我们真正要找的物体,哪几个又该删除。例如在做人脸检测时,模型输出的可能是左图,而最终我们得到的是右图。在我们得到最终的输出后,也可以拿...原创 2021-03-30 10:22:35 · 126865 阅读 · 0 评论 -
logistic回归是一个二分类模型
logistic回归,又叫对数几率回归(从后文中便可此名由来)。首先给大家强调一点,这是一个分类模型而不是一个回归模型!下文开始将从不同方面讲解logistic回归的原理,随后分别使用梯度上升算法和随机梯度上升算法将logistic回归算法应用到实例中。一、logistic回归和线性回归的关系想必大家也早有疑惑,既然logistic回归名字中都带有“回归”二者,难道和回归模型一点关系都没有!没错,二者是有联系的,下面我们便来谈一谈!首先给出线性回归模型:写成向量形式为:同..原创 2021-03-09 16:56:49 · 124925 阅读 · 1 评论 -
keras特征图可视化:visualize_feature_map
版本:(labelme) C:\Users\wym\Desktop\cjr\Centernet-Tensorflow2.0\TF2-CenterNet>1、pip install keras2、pip install tensorflow-cpu==2.2.0img:feature_map:# coding: utf-8from keras.applications.vgg19 import VGG19from ke...原创 2021-03-09 14:32:54 · 124186 阅读 · 0 评论 -
整理下深度学习常见的学习平台
原创不易,转载请注明出处。1、深度学习在线平台2、深度学习资源原创 2021-03-08 16:47:44 · 111963 阅读 · 0 评论 -
目标检测基础:好文推荐
温故知新,每一次重复都有新的体会与感悟。☆☆☆☆☆重度好文推荐☆☆☆☆☆深度学习笔记(六)--VGG16网络https://blog.csdn.net/qq_29893385/article/details/81207082目标检测之R-CNN系列https://blog.csdn.net/shinetzh/article/details/84825090深度学习目标检测之 R-CNN 系列:Faster R-CNN 网络详解https://blog.csdn.net/kuwei原创 2021-03-03 21:33:25 · 2967 阅读 · 1 评论 -
模型评价指标:误报率、漏报率、准确率和召回率(虚警率、漏警率)
Tensorflow计算正确率、精确率、召回率、虚警率和漏检率https://blog.csdn.net/sinat_35821976/article/details/81334181数据挖掘之分类指标:召回率 、精确度、准确率、虚警率和漏警率https://blog.csdn.net/smallnetvisitor/article/details/84650141机器学习中准确率、精确率、召回率、误报率、漏报率、F1-Score、AP&mAP、AUC、MAE、MAPE、MSE、RM原创 2021-03-03 21:24:32 · 115504 阅读 · 1 评论 -
损失函数篇:L1、L2、smooth L1损失函数
可见,使用 MSE 损失函数,受离群点的影响较大,虽然样本中只有 5 个离群点,但是拟合的直线还是比较偏向于离群点。从上面可以看出,该函数实际上就是一个分段函数,在[-1,1]之间实际上就是L2损失,这样解决了L1的不光滑问题,在[-1,1]区间外,实际上就是L1损失,这样就解决了离群点梯度爆炸的问题实现 (PyTorch)def _smooth_l1_loss(input, target, reduction='none'): # typ...原创 2021-03-02 15:40:15 · 123239 阅读 · 0 评论 -
基于深度学习的视频分类
视频与图像视频分类概念视频分类数据集视频分割融合并行CNN进行分类长时间视频分类双CNN视频动作识别3D卷积时间维度学习轨迹视频分类多模特融合视频分类区域attention视频分类...原创 2020-08-02 09:26:27 · 1671 阅读 · 0 评论 -
yolo5的改进策略
YOLO V5的作者并没有发表论文,对yolo5分析只能从源码进行分析;相比于yolo4,yolo5在原理性方法没有太多改进,但是在速度与模型大小上比yolo4有较大提升,可以认为是通过模型裁剪后的工程化应用(即推理速度和准确率增加、模型尺寸减小)。从以下几个方面说明yolo5的改进之处:Data Augmentation Auto Learning Bounding Box Anchors Backbone Neck Head Network Architecture Activ原创 2020-10-26 14:18:29 · 55947 阅读 · 13 评论 -
yolo5测评-ubuntu环境下
vim ~/.condarc channels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/show_channel_...原创 2020-10-23 20:24:30 · 25504 阅读 · 2 评论 -
YOLOV3网络剪枝
YOLOV3剪枝论文:Network Slimming-Learning Efficient Convolutional Networks through Network Slimming剪枝项目参考https://github.com/tanluren/yolov3-channel-and-layer-pruning主要思路 1、利用batch normalization中的缩放因子γ 作为重要性因子,即γ越小,所对应的channel不太重要,就可以裁剪(pruning)。 2原创 2020-10-09 11:09:42 · 13499 阅读 · 1 评论 -
YOLOv3损失函数
...转载 2019-12-24 09:30:28 · 2048 阅读 · 0 评论 -
身份证识别 python + OCR
包括只有2个文件,video.py是测试在线摄像头的代码,IDrec.py是识别身份证的代码。使用方法:版本:python3.6.9github:https://github.com/lvxiaojie111/OCR下载源码,并安装python、pillow、opencv的python版, 运行IDrec.py即可代码中有详细的安装说明及使用注释代码实现的功能:①、英文识别②、中文识别(只能对中规中矩的大的字体进行识别)③、中英文预处理后识别④、中英文原始图片识别⑤原创 2020-10-04 18:15:36 · 14703 阅读 · 10 评论 -
【数据集】计算机视觉,深度学习,数据挖掘数据集整理
金融美国劳工部统计局官方发布数据 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票 MT4平台外汇交易历史数据 Forex平台外汇交易历史数据 几组外汇交易逐笔(T...转载 2019-09-10 18:30:06 · 4506 阅读 · 0 评论 -
支持向量机在多类分类问题中的推广
SVM本身是一个二值分类器 SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器。 目前,构造SVM多类分类器的方法主要有两类 (1)直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单,但其计算复杂度比较高,实现起来比较困难,只适合用于小型问题中; (2)间接法,主要是通过组合多个二分类器来实现多分类器的构造,常见的方法有one-against-one和one-ag原创 2021-01-25 11:22:55 · 148932 阅读 · 0 评论 -
卡尔曼滤波(kalman)相关理论以及与HMM、最小二乘法关系
一、什么是卡尔曼滤波 在雷达目标跟踪中,通常会用到Kalman滤波来形成航迹,以前没有学过机器学习相关知识,学习Kalman时,总感觉公式看完就忘,而且很多东西云里雾里并不能深入理解,最后也就直接套那几个递推公式了。通过上一篇CRF,我们可以顺便回顾一下HMM,事实上,这几种算法和Kalman之间是有联系的,这个联系,据说是在PRML这本书的第13章里讲的线性动态系统(LDS)讲的,有机会一定好好拜读一下!那么什么是Kalman滤波呢? 首先,简单的理解就是:对于一个目标,它会具有一定的速...转载 2020-08-19 18:10:07 · 14845 阅读 · 0 评论 -
矩阵 维度 axis
python numpy tenforflow中维度的概念是什么呢?怎么用python语言来表示维度呢?我们在利用深度学习进行目标检测的过程中,经过会进行批量图片的处理,常见格式为(batchsize,size,size,channel)四维的矩阵。或者yolo3 backbone输出的矩阵(batch,feature_map_size,feature_map_size,anchor_num,(xmin,ymin,xmax,ymax,socre,class1,...,classn))等。在处理过程中原创 2020-08-08 12:38:16 · 5339 阅读 · 0 评论 -
python实现感知机模型
这篇文章通过对花鸢尾属植物进行分类,来学习如何利用实际数据构建一个感知机模型,(包括如何利用python实现GD和SGD参数更新)。原创 2020-05-22 10:24:51 · 2851 阅读 · 0 评论 -
【YOLO】yolo v1到yolo v3
faster rcnn,fast rcnn等是将整体流程划分为区域提取和目标分类两部分进行的,这样做的特点是精度高,速度慢。YOLO(you only look once)是真正实现端到端的目标检测算法。一、YOLO v1YOLO v1的核心思想是将目标检测作为回归问题解决。其过程如下:(1)将原始图片尺寸变为448×448;(2)将图片划分为SxS个网格。每个网格预测B个boun...原创 2020-01-11 16:37:46 · 660 阅读 · 0 评论 -
机器学习算法中的准确率(Precision)、召回率(Recall)、F值(F-Measure)
机器学习算法中的准确率(Precision)、召回率(Recall)、F值(F-Measure)摘要: 数据挖掘、机器学习和推荐系统中的评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)简介。引言: 在机器学习、数据挖掘、推荐系统完成建模之后,需要对模型的效果做评价。业内目前常常采用的评价指标有准确率(Precision)、召回率(R...原创 2020-01-11 16:23:30 · 1911 阅读 · 1 评论 -
FSAT RCNN详解
https://www.cnblogs.com/wangyong/p/8513563.html原创 2020-01-10 13:55:19 · 391 阅读 · 0 评论 -
YOLOv3 算法的详细说明
YOLOv3 算法的详细说明YOLOv3没有太多的创新,主要是借鉴一些好的方案融合到YOLO里面。不过效果还是不错的,在保持速度优势的前提下,提升了预测精度,尤其是加强了对小物体的识别能力。本文主要讲v3的改进,由于是以v1和v2为基础,关于YOLO1和YOLO2的部分析请移步YOLO v1深入理解和YOLOv2 / YOLO9000 深入理解。YOLO3主要的改进有:调整了网络结...原创 2019-09-11 12:14:56 · 13325 阅读 · 2 评论 -
yolo3+python3.6
以前学习时收藏的资料,整理电脑,放在此处,以备后用何为 YOLO(You Only Look Once)YOLO[点击]充满青春暗示的另一面,更是一个强大物体检测算法的简称,其算法结合了速度与准确度,近期更推出了第三版的 model 供大家参考,大幅度提升了前一版的性能。作者为一位资深 computer scientist: Joseph Chet Redmon 精通数据科学,编程等工作,与另外四名伙伴一同开发了此模型。与以往的重复定位不同图片区域,并多次加权算出最高的得分区域来衡量该...转载 2021-01-11 19:13:21 · 145034 阅读 · 0 评论 -
TensorBoard简介
以前学习用的资料,整理电脑,放在这里,以备后续使用TensorBoard简介 TensorBoard是TensorFlow自带的一个强大的可视化工具,也是一个Web应用程序套件。TensorBoard目前支持7种可视化,Scalars,Images,Audio,Graphs,Distributions,Histograms和...转载 2021-01-11 19:05:19 · 178251 阅读 · 0 评论 -
Inception网络
Inception 网络是 CNN 分类器发展史上一个重要的里程碑。在 Inception 出现之前,大部分流行 CNN 仅仅是把卷积层堆叠得越来越多,使网络越来越深,以此希望能够得到更好的性能。例如第一个得到广泛关注的 AlexNet,它本质上就是扩展 LeNet 的深度,并应用一些 ReLU、Dropout 等技巧。AlexNet 有 5 个卷积层和 3 个最大池化层,它可分为上下两个完全相同的分支,这两个分支在第三个卷积层和全连接层上可以相互交换信息。与 Inception 同年提出的优秀网络还有原创 2021-01-11 18:52:38 · 161178 阅读 · 2 评论 -
1*1卷积经典回答
1*1的卷积看似没有变换维度,其实是有的,因为我们操作的对象是feature map。对于一张feature map,你可以看作一张图。一张彩色的图像一般有3个颜色通道(RGB),而对一张feature map可能有N个通道,他是由上一次的N的filter生成的。在卷积时,若我们假定该卷积层有M个filter,则在卷积时,每个filter会对每一个通道都去卷积一遍,然后最后通过求和把每个通道的卷积结果通过线性组合(求和等),得到最终的卷积。也就是说对于一张宽度W,高度H,通道数N的feature map (转载 2020-08-13 13:10:26 · 11329 阅读 · 0 评论 -
深度学习中的tile()函数理解
函数定义tensorflow中的tile()函数是用来对张量(Tensor)进行扩展的,其特点是对当前张量内的数据进行一定规则的复制。最终的输出张量维度不变。函数定义:tf.tile( input, multiples, name=None)input是待扩展的张量,multiples是扩展方法,扩展后的维数不变。假如input是一个3维的张量。那么mutiples就必须是一个1x3的1维张量。这个张量的三个值依次表示input的第1,第2,第3维数据扩展几倍原创 2020-08-05 08:56:53 · 2831 阅读 · 0 评论 -
手撸CNN代码
from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfmnist = input_data.read_data_sets("MNIST_data/", one_hot=True)# 读取图片数据集sess = tf.InteractiveSession()# 创建session# 一,函数声明部分def weight_variable(shape):# 正态分布,标准差为0..原创 2020-07-04 09:40:24 · 1133 阅读 · 0 评论 -
网络爬虫之re模块
1. re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。import reline="this hdr-biz 123 model server 456"pattern=r"123"matchObj = re.match( pattern, line)output:None语法:re.match(pattern,string,[flags])参数说明:pattern 表示模式字符串,由要匹配的正则表达式转化而来。s.原创 2020-06-20 11:36:43 · 19645 阅读 · 0 评论 -
手把手教你如何使用git命令
Administrator@MS-20190116GSCG MINGW64 ~ (master)$ /d/VOCdevkit/VOC2012bash: /d/VOCdevkit/VOC2012: Is a directoryAdministrator@MS-20190116GSCG MINGW64 ~ (master)$ cd /d/VOCdevkit/VOC2012Administrator@MS-20190116GSCG MINGW64 /d/VOCdevkit/VOC2012$ gi.原创 2020-06-15 16:02:29 · 514 阅读 · 0 评论 -
傅里叶变换在图像处理中的应用
基本概念傅立叶变换在图像处理中有非常非常的作用。因为不仅傅立叶分析涉及图像处理的很多方面,傅立叶的改进算法,比如离散余弦变换,gabor与小波在图像处理中也有重要的分量。印象中,傅立叶变换在图像处理以下几个话题都有重要作用:1.图像增强与图像去噪绝大部分噪音都是图像的高频分量,通过低通滤波器来滤除高频——噪声;边缘也是图像的高频分量,可以通过添加高频分量来增强原始图像的边缘;2.图像分割之边缘检测提取图像高频分量3.图像特征提取:形状特征:傅里叶描述子纹理特征:直接通过傅里叶系..原创 2020-06-06 07:37:21 · 14068 阅读 · 0 评论 -
MobileNet网络详解
MobileNet网络结构是一款轻量级的移动终端神经网络,到目前为止有V1和V2两个版本。V1版本的主要思想是深度可分离卷积,Inception网络的结构设计思想就是将卷积通道相关和空间通道相关进行分离(如下图所示)Xception的构造也是沿用上面的思路,结构如下图所示:更多关于v1的相关内容,请参考https://www.jianshu.com/p/38dc74d12fcf?utm_source=oschina-app https://blog.csdn.net/Einstel原创 2020-06-05 15:25:09 · 3917 阅读 · 0 评论 -
Pedestrian Detection paper
一、论文综述类的文章[1]P.Dollar,C.Wojek,B.Schiele,etal.Pedestriandetection:anevaluationofthestateoftheart[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2012,34(4):743-761.[2]M.Enzweiler,andD.Gavrila.Monocularpedestr...原创 2020-06-03 20:36:25 · 211 阅读 · 0 评论