![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 57
ChunyeLi
方向:深度学习、自然语言处理、深度学习
展开
-
模型复杂度
模型复杂度分析原创 2022-08-12 15:12:09 · 577 阅读 · 1 评论 -
yolov4论文解读
文章目录目的introductionRelated workObject detection modelsBags of freebiesBag of specials目的寻找CNN中的通用trickintroduction实时(用一个GPU),训练也只用一个GPU,准确性高。contributionsRelated workObject detection models一个检测器:①backbone(预训练)②neck(提取不同阶段的特征)③head(预测分类与回归)Bags原创 2022-02-28 14:25:47 · 2576 阅读 · 2 评论 -
yolo理论合集
yolo1xy是小网格中的,(0,1)w,h是整个图像中的 ,(0,1)confidence=bounding box是否含有object×预测的与gt之间的iou。为每个目标的概率+预测的目标边界框和真实的目标边界框的重合程度。为什么w和h要根号?假设蓝色为预测的边界框,绿色为真实边界框。假设目标越小 ,预测的边界框与真实边界框偏移相同的情况下 ,IOU就越大,检测效果越差。所以应该要让小目标的偏差设的更大一些。confidence损失的前一项是正样本(C=1)的损失计算原创 2022-02-27 17:11:49 · 880 阅读 · 0 评论 -
attention算法浅记
Transformerself attentionRNN,LSTM均需要先输出t0,才能输出t1…(串行)Transformer可无限长记忆,和并行。W权重共享,为同一个。d为v^1中的元素数量Multi-head Self-Attention位置编码,当a3和a2调换时,也应有影响...原创 2022-02-24 15:38:40 · 448 阅读 · 0 评论 -
mmdetection源码 内容说明
学习率每次降低就降低为原来的1/10,到总轮数时停止,上图是1x的过程。原创 2021-11-28 21:26:30 · 97 阅读 · 0 评论 -
目标检测 (单阶段 无锚框 实例分割 评估)
文章目录单阶段无锚框目标检测算法小结实例分割评估单阶段无锚框目标检测算法小结实例分割评估原创 2021-11-28 20:15:15 · 2871 阅读 · 0 评论 -
rcnn fast-rcnn faster-rcnn
整个模型:原创 2021-11-27 16:28:01 · 1124 阅读 · 0 评论 -
linux平台的mmdetection安装
前提:安装好anaconda1.创建新的环境,本文将新环境名称设为mmdetconda create -n mmdet python=3.72.安装pytorchconda install pytorch=1.7.0 torchvision=0.8.03.安装cuda因为本文的环境已有全部cuda,所以无安装过程。本文选择cuda-10.2-cudnn-7.6.5版本4安装mmcv,本文选择1.3.3。注意:一定要加fullpip install mmcv-full==1.3.3原创 2021-11-22 21:28:32 · 3079 阅读 · 1 评论 -
在centos7上基于rocm成功源码编译pytorch(pytorch1.6.0 + rocm3.3 + vision0.7.0)以及rocm的更换版本步骤
编译安装流程(如果是ubuntu用apt,centos用yum)1.提高gcc版本(本次编译用的是gcc 7包含及以上的版本),python版本为3.6,pip版本为212.将apt(yum)更新至最新sudo apt update(yum update)3.确保ROCm的包已经完全安装sudo apt install rock-dkms rocm-dev rocm-libs miopen-hip miopengemm hipsparse rccl rocthrust hipcub roc原创 2021-09-13 11:32:23 · 2052 阅读 · 0 评论 -
im2col_kernels.cu
im2col_kernels.cu#include "cuda_runtime.h"#include "curand.h"#include "cublas_v2.h"extern "C" {#include "im2col.h"#include "cuda.h"}// src: https://github.com/BVLC/caffe/blob/master/src/caffe/util/im2col.cu// You may also want to read: https://g原创 2021-08-12 22:54:25 · 425 阅读 · 0 评论 -
im2col总结
目录原理darknet中im2col.c原理为了将稍复杂的卷积相乘转化为“平摊式”的矩阵相乘,im2col完成了这种向量的转化过程,为之后的矩阵相乘做数据准备。darknet中im2col.cdarknet是按行存储。#include "im2col.h"#include <stdio.h>/***<从图像数据im中提取指定元素的所在行、列、通道数>*param *im 一维数据,每通道按行存储,再将多通道依次拼接而成*param .原创 2021-05-24 11:14:09 · 620 阅读 · 2 评论 -
Darknet yolov4数据集处理及训练推理
文章目录darknet包的下载编译下载yolov4.weights文件数据集数据集下载数据集介绍数据处理配置文件的设置功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入darknet包的下载AlexeyAB版github编译原创 2021-04-02 10:44:25 · 976 阅读 · 3 评论 -
深度学习PyTorch(三)循环神经网络
基础没有办法找到非常前面的信息原创 2019-08-09 21:30:59 · 1238 阅读 · 2 评论 -
torch.cat()
torch.cat()举例如下:import torchimport numpy as npx=np.array([[1,2,3],[4,5,6]])y=np.array([[7,8,9],[10,11,12]])print("=================x=====================")print(x)print("=================y===...原创 2019-08-09 21:01:24 · 739 阅读 · 0 评论 -
深度学习PyTorch(二)卷积神经网络
背景及应用基础及计算因为是彩色图片,所以有RGB三个通道。传统方法处理图像卷积引入卷积十字架元素不等于零。卷积运算左边的矩阵是输入图像抽取的一部分,表示每一个像素点的像素值。卷积运算到运算规则卷积扩充0来增加卷积输出的大小:以上输出矩阵从4×4到6×6,还可以保留边缘信息。原本边缘信息只能用到一次,用这个方法可以用到很多次。我们在矩阵外部补零...原创 2019-08-05 18:17:49 · 1977 阅读 · 1 评论 -
深度学习PyTorch(一)pytorch基础&神经网络
科学计算库 numpy,数据分析库 pandas,可视化绘图工具Matplotlib国内:百度的 apollo,duos 技术底层就是图像识别和语音识别技术,讯飞的的语音识别技术用的是深度学习人工智能四小龙:旷视 图森 商汤 依图这几个企业里面面部识别,语音识别也用的深度学习机器学习:图片–feature extracting-encoding-classification-分类结果...原创 2019-08-02 13:18:29 · 1141 阅读 · 0 评论 -
GAN笔记_李弘毅教程(一)Introduction
因为本文课题需要用到GAN,因此学习下GAN,笔记内容均为本人看李弘毅老师视频时记下的要点。以下为正文:李弘毅老师教程视频来自blibli。简介在人工智能研究领域,Yann LeCun、Geoffrey Hinton 和 Yoshua Bengio一直被公认为深度学习三巨头。since sliced bread (由此以来 )GAN动物园有历年来的GAN技术。现在通常用condi...原创 2018-10-31 17:17:49 · 334 阅读 · 0 评论 -
GAN笔记_李弘毅教程(二)Conditional Generation
文章目录Text-to-Image算法Text-to-Image用传统监督方法,火车有侧面图片也有正面图片,而训练的结果往往是产生多张火车图片(有正面、侧面)的平均,所以生成图片会比较模糊:火车图片和Z共同输入至G中,生成一个图像x=G(c,z)x = G(c,z)x=G(c,z);让D能判断出真实图片为1,生成图片为0;然后G能输出偏真实的图片;但完全忽略了输入的条件:如果是c...原创 2018-10-31 23:21:21 · 425 阅读 · 6 评论 -
GAN笔记_李弘毅教程(三)Unsupervised Conditional Generation
文章目录引文Direct TransformationProjection to Common Space引文风景照—画作(风格迁移):Unsupervised Conditional Generation有两种方法:第一种的直接转化通常是颜色上的改变;而当差距很大的时候,用第二种方法:Direct Transformation1.让DY{D_Y}DY判断输入的图片是属于Dom...原创 2018-11-06 17:02:33 · 277 阅读 · 0 评论 -
GAN笔记_李弘毅教程(六)WGAN、EBGAN
在大多数情况下,PG{P_G}PG和Pdata{P_{data}}Pdata训练到最后是不会重叠的。因为有两点。1.data本质:PG{P_G}PG和Pdata{P_{data}}Pdata是高维空间中的低维合成,这个重叠几乎是可以忽略的。(开始训练时)2.从Sample角度来说,Sample两个部分,这两个部分交叠的部分也比较少。当PG{P_G}PG和Pdata{P_{dat...原创 2018-11-09 13:25:59 · 463 阅读 · 0 评论 -
GAN笔记_李弘毅教程()Basic Theory
文章目录这一章节主要讲的是GAN的一些基础知识distribution在蓝色区域才能生成人脸,否则会很模糊。那怎么找出这个distribution?用最大似然估计,这里要有点相关基础。可见 https://www.jianshu.com/p/f1d3906e4a3e这个过程相当于最小化KL散度。以下这个过程有点像在凑KL散度的定义式,KL散度表征的是两个概率分布的差异,两者差异越...原创 2018-11-07 22:59:32 · 198 阅读 · 0 评论 -
GAN笔记_李弘毅教程(a)Basic Theory
文章目录这一章节主要讲的是GAN的一些基础知识distribution在蓝色区域才能生成人脸,否则会很模糊。那怎么找出这个distribution?用最大似然估计,这里要有点相关基础。可见 https://www.jianshu.com/p/f1d3906e4a3e这个过程相当于最小化KL散度。以下这个过程有点像在凑KL散度的定义式,KL散度表征的是两个概率分布的差异,两者差异越...原创 2018-11-08 10:38:51 · 178 阅读 · 0 评论 -
GAN笔记_李弘毅教程(五)General Framework
f-divergence都可以放到GAN架构中。f是凸函数并且f(1)=0当p=q时,divergence为0,0是最小值。代入不同的f(x)f(x)f(x),即有不同的KL。每一个f(x)f(x)f(x)都有一个f∗f^*f∗,凸共轭。有两种方法,分别为穷举法和画图法穷举法:穷举x,看当x等于多少时,能使f∗f^*f∗最大。当t1{t_1}t1时,x1{x_1}x1最...原创 2018-11-08 23:10:31 · 632 阅读 · 0 评论 -
GAN笔记_李弘毅教程(九)Sequence Generation
Improving Sequence Generation by GAN Conditional Sequence Generation 以chat-bot 为例,正确答案应该是“I‘m good”,输出的结果和它越接近越好,实际上“Not bad”也是正确回答,对于机器来说“I’m John”相比“Not bad”,与正确答案更加相似。Improving seq2seq model...原创 2018-11-15 22:24:00 · 622 阅读 · 0 评论 -
GAN笔记_李弘毅教程(七)Info GAN,VAE-GAN,BiGAN
原创 2018-11-12 17:03:25 · 3400 阅读 · 0 评论 -
GAN笔记_李弘毅教程(十)Evaluation & Concluding Remarks
EvaluationLikelihood传统generator的方法产生某一张特定图片的几率。但问题是:GAN可能不会产生那张特定图片所以用Kernel Density Estimation每一个输出的样本是有相同协方差的高斯的平均值,估出它们的distribution难点:不知道要几个高斯不知道要sample多少就算真计算出 likelihood,也不确定它就能代表Qua...原创 2018-11-16 10:08:41 · 370 阅读 · 0 评论 -
GAN笔记_李弘毅教程(八)Photo Editing
Demo可以根据调节参数来变化特征要知道输入的每一维控制输出的什么特征。G输入z,输出x;如果已知x(图片和标签),我们如何知道生成x的z(vector)?学习一个encoderDecoder不动,只train encoder,修正Encoder的最后一层。实际上可以拿D的参数来初始化Encoder的参数。这样当给出一些image,就可以反推出它们的vector。下图公式:长发...原创 2018-11-15 12:55:58 · 389 阅读 · 0 评论 -
JAVA笔记_(Day09)抽象&接口&多态
原创 2018-12-17 16:57:23 · 179 阅读 · 0 评论