自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(185)
  • 资源 (8)
  • 收藏
  • 关注

原创 pytorch模型转为tensorrt engine的通用流程

安装onnxsim库。

2023-08-09 10:04:41 418

原创 tensorrt官方int8量化方法汇总

int8量化对小目标检测影响较大;int8量化相比fp16量化推理时间并不会节省一半,需实测;当fp16推理时间满足要求时,请采用fp16量化;

2023-08-08 15:38:53 940 1

原创 模型与计算平台

说明:部分内容摘自参考文献,如有侵权,联系删除。

2023-07-14 13:26:38 369

原创 yolov8检测框过小解决方案

训练集上最大边长:ultralytics/yolo/utils/loss.py(此为8.0.117版本位置,前期版本位置不太一样,找到训练的loss函数即可),在loss函数中加入打印,即以下代码中的print。分析:dfl loss是检测框和真实框比较相近时(即在真实框的某个相近范围内),loss就会很小,个人理解是一种软标签,而我们平时用的box loss是硬标签,此时要加大box loss在loss中的权重。将self.reg_max设置为1,即不采用dfl loss,查看检测框是否正常;

2023-07-11 10:47:49 1219

原创 Bytetrack简记

说明:本文是根据代码对bytetrack算法的大致过程做记录。

2023-04-26 13:14:49 162

原创 conda的极速安装包mamba

在装torch和torvision时不建议使用pip,pip安装不能解决环境依赖的问题,而conda可以,但是conda安装包时,速度很慢,因此推荐conda的急速安装包mamba。方式1:conda安装。

2023-04-11 16:00:44 1220 2

原创 使用ubuntu-drivers devices查找nvidia driver安装避坑

作为服务器使用的ubuntu系统,通常可以采用apt install安装显卡驱动。如果上述命令,显示有问题,可重启电脑,再nvidia-smi。选择想要安装的驱动版本进行安装。

2023-04-11 15:10:31 2686 3

原创 ubuntu cpp工程环境安装与编译

文章目录1. cmake及依赖安装2.cmake-gui安装3. 编译安装opencv3.1 下载opencv源码3.2 解压安装包3.3 cmake-gui设置及编译3.4 终端编译4. cpp IDE安装1. cmake及依赖安装sudo apt install cmakesudo apt install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavform

2021-07-21 17:49:33 606 2

原创 tensorrt+opencv c++工程编译的问题

opencv编译请点我问题1 CMakeLists.txt的写法cmake_minimum_required(VERSION 3.10)set(CMAKE_CXX_STANDARD 14)set(CMAKE_CXX_STANDARD_REQUIRED TRUE)set(CMAKE_MODULE_PATH "${CMAKE_SOURCE_DIR}" ${CMAKE_MODULE_PATH})set(CMAKE_INCLUDE_CURRENT_DIR ON)set(CMAKE_AUTOMOC O

2021-07-21 17:45:43 1056 3

原创 opencv+libtorch c++工程问题及解决方案

问题1:CMakeLists设置cmake_minimum_required(VERSION 3.17)project(enhance)set(CMAKE_INCLUDE_CURRENT_DIR ON)set(CMAKE_AUTOMOC ON)set(BOOST_LIBRARYDIR "/usr/lib/x86_64-linux-gnu")find_package(Qt5Core)add_executable(${PROJECT_NAME} "main.cpp" xx.h xx.cpp x

2021-04-26 09:28:59 988 3

原创 You Only Look One-level Feature(YOLOF)

paper codeMotivation目标检测中常用到特征金字塔(FPN),在各网络中证明FPN确实有效,通常认为其有效得益于两个方面:(1)多尺度特征融合:融合了多种高分辨率和低分辨率的特征获取到更好的特征表达;(2)分而治之:根据目标的大小在不同层进行目标检测。目标检测的网络结构可以分为三大部分:backbone、encoder、decoder,如下所示:对encoder设计如下结构Figure 1进行实验,验证FPN的有效性是得益于多特征融合还是分而治之通过实验发现SiMo作为enc

2021-03-23 16:08:12 391

原创 deepinV20 显卡驱动 cuda10.2+cudnn配置

前言因为deepin15.11无线网驱动有问题,导致内部资料传输很慢,因此在deepin v20出来之后,开始挖坑填坑。尽管官方给出了从15.11直接升级到V20版本的方案,试过后,发现显卡驱动有问题,新的也装不上,旧的也卸载不了。因此采用从头安装的方案,此间遇到不少坑,还好最后都解决了。deepin v20安装安装时花屏解决方案:在系统安装时,有一个选项,大致意思是安装20desktop(忘记截图,还挺长,这个是第一个选项),此时选择第二个选项,就是后边带有(safe graphics

2020-09-18 16:17:59 2162

原创 文字图像超分辨率论文笔记

TextSR: Content-Aware Text Super-Resolution Guided by Recognition论文链接:https://arxiv.org/abs/1909.07113代码:https://github.com/xieenze/TextSR网络结构:SRGAN网络的基础上加文字识别网络,文字识别网络采用的是ASTER;损失函数:1)SR采用的是VGG的感知损失以及对抗损失;2)文字感知损失如下:上图中蓝线是训练过程,红线是推理过程;训练:3种训练方

2020-09-10 11:41:13 1056

原创 RealSR算法汇总

RealSRNTIRE2020真实超分双赛道冠军;两阶段:1)自监督数据生成;2)监督SR超分;作者提出一种新的数据制作方案:统计模糊核与真实噪声分布并用于制作训练数据对;可以使得LR与真实世界图像处于同域,进而将提升图像超分的性能;作者提出一种真实世界超分模型以获得更好的感知效果真实世界超分的关键问题在于如何引入精确的降质模型以确保生成的LR图像与原始图像具有同域属性(比如噪声分布、模糊等)在实际场景,HR图像、模糊核和噪声均未知的。为更精确的估计降质模型,我们需要从图像中估计模糊核与噪声。

2020-07-30 13:14:12 3296

原创 MuCAN: Multi-Correspondence Aggregation Network for Video Super-Resolution论文笔记

论文链接:https://arxiv.org/abs/2007.11803代码:未公开ECCV2020前言当前VSR算法所存在的问题:1)通常采用光流来建立时间相关性,但是光流估计易有误,从而影响重建结果;2)VSR算法极少采用自然图像中本就存在的相似模式。之前的VSR算法对对齐和回归两个阶段单独建模,本文将VSR看作帧内和帧间集成任务。本文所依据的现象:连续帧具有相似内容;同一帧内不同位置具有相似内容。帧间相关性:为了验证作者的想法,实验设置:在MPI-Sintel Flow数据集上,用一.

2020-07-28 13:42:07 1154 1

原创 图像超分辨率论文笔记

Real-World Super-Resolution via Kernel Estimation and Noise Injection论文链接:http://openaccess.thecvf.com/content_CVPRW_2020/papers/w31/Ji_RealWorld_SuperResolution_via_Kernel_Estimation_and_Noise_Injection_CVPRW_2020_paper.pdf代码:RealSRCVPR2020, NTIRE2020

2020-06-18 11:33:34 1392

原创 视频超分辨率论文笔记

持续更新Deep SR-ITM: Joint Learning of Super-Resolution and Inverse Tone-Mapping for 4K UHD HDR Applications论文连接:https://arxiv.org/ftp/arxiv/papers/1904/1904.11176.pdf代码:https://github.com/sooyekim/Deep-SR-ITM (matlab)CVPR 2019 oral网络结构:初始图像分解为base l

2020-06-15 18:28:42 2359

原创 行人检测几篇论文相关笔记

这部分内容会持续更新,比较难的论文会单独开篇博文讲解,相对比较简单的就只写概要记录在此篇博文中。PedHunter: Occlusion Robust Pedestrian Detector in Crowded Scenes链接:https://arxiv.org/abs/1909.06826代码:https://github.com/ChiCheng123/PedHunter(...

2020-01-17 11:51:03 674 2

原创 Double Anchor R-CNN for Human Detection in a Crowd论文笔记

论文链接:Double Anchor R-CNN for Human Detection in a Crowd论文题目表明该算法应用场景为 拥挤人群的人体检测。一、摘要人体检测的难题:1)拥挤遮挡问题;2)后处理的NMS,很难确定阈值,太大会导致误检多,太小漏检较多,如图1所示;现象:相比于人体,头部特征更为明显,头和头之间的交叉肯定比人小很多;思想:将头部检测添加到人体检...

2020-01-15 13:46:04 1614

原创 CUDA ERROR: device-side assert triggered问题解决思路

这个问题很可能是代码有问题,先排查错误step1在environment variable中添加:CUDA_LAUNCH_BLOCKING=1这样更容易定位到出现问题的地方step2再排查报错附近的原因,就在报错附近。我今天处理NLP,出现该问题的原因是:词的索引> embedding层词量...

2020-01-10 16:06:57 11814 3

原创 词向量相关总结

最近准备把词向量相关知识串一下,会持续更主要参考:https://zhuanlan.zhihu.com/p/95304317unigram模型:所有的词都是相互独立的P(w1,w2,...,wn)=∏i=1nP(wi)P(w_1,w_2,...,w_n)= \prod_{i=1}^n P(w_i)P(w1​,w2​,...,wn​)=i=1∏n​P(wi​)bigram模型:每一个词...

2019-12-18 14:52:55 469

原创 ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs论文解读

发表时间:2015论文链接:https://arxiv.org/pdf/1512.05193.pdf开源代码:https://github.com/galsang/ABCNN (tensorflow) https://github.com/lsrock1/abcnn_pytorch (pytorch)代码语言:python适用: Answer Slection(AS) paraphra...

2019-11-26 15:15:44 654

原创 关于loss不收敛的一些建议

之前训练网络时,会先编写学习率随训练epoch的增加而逐渐减低的函数,然后选取一个相对较大的学习率(一般从e-2量级开始),选取一个epoch能够接受的batchsize,如果loss稳定下降较快,则开始训练.从未体验过学习率和batchsize搭配之难.最近新看了一篇论文ABCNN(有空再细讲),采用开源的tensorflow工程训练一下,效果很好,因工程需要,开始将其移植到pytorch...

2019-11-20 10:45:16 9845 9

原创 Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_BAD_PARAM

在python上加载caffe 的网络时会报上述错误,解决方案如下1.在报错的相应层添加 engine: CAFFE结果:加载网络时没有报错,但是net.forward前向计算时,会报Check failed: status == CUDNN_STATUS_SUCCESS (8 vs. 0) CUDNN_STATUS_BAD_PARAM解决如下2.重新编译caffe源码编译时, US...

2019-10-22 11:21:04 750

原创 pycharm+Docker+GPU配置

要求pycharm为专业版;已经安装好docker、nvidia-docker2,此部分安装可参见博客deepin安装docker;cuda、cudnn安装好配置步骤:打开pycharm, 点击File->Settings->Project Interpreter2. 点击add…,出现界面如下:3. 点击界面左侧的 Docker右侧界面Server: 点击...

2019-10-15 14:06:45 678

原创 FreeAnchor: Learning to Match Anchors for Visual Object Detection论文详解

问题在基于anchor的目标检测算法中,训练时,通常通过anchor和真实object 框之间的IoU来决定该anchor是否用来预测object (包括类别和位置),通常IoU超过某一阈值则认为该anchor为正例(即作为预测object ),小于某一阈值则认为该anchor为背景。本文的思想就是通过修改loss函数去除人工参与指定anchor的过程,使网络能够自主学习选择哪个anchor和真...

2019-09-18 20:16:57 1371 2

原创 Task-oriented Dialogue System for Automatic Diagnosis论文笔记

发表时间:2018论文链接:https://www.aclweb.org/anthology/P18-2033代码:https://github.com/LiuQL2/MedicalChatbot代码语言:python摘要本文构建了一个用于自动诊断的对话系统。首先,从线上医学论坛上病人的自述以及病人医生间的交谈中提取症状,从而构建数据集;然后,本文提出了用于自动诊断的任务型对话系统框...

2019-09-05 11:31:01 1247

原创 Convolutional Neural Network Architectures for Matching Natural Language Sentences论文笔记

发表时间:2015年论文链接:https://arxiv.org/abs/1503.03244v1代码链接:http://nlp.stanford.edu/˜socherr/classifyParaphrases.zip代码语言:matlab摘要较好的匹配算法能够同时为句子内部结构和句子间的交互信息建模。本文提出的模型通过逐层构图和合并充分表达句子的层次信息,而且能够在不同的层次捕捉...

2019-09-04 14:10:10 1243

原创 修改conda安装虚拟环境路径

之前我采用conda安装虚拟环境时,都是安装到miniconda下的envs中,换了系统后,就一直安装到/home/XX/.conda/envs中,导致我编译一些项目报错,并且随着虚拟环境越来越多,会占用大量的系统盘,因此,我要将虚拟环境的默认路径给改掉。1.查看当前的环境输入以下命令conda info会出现可以看到虚拟环境的默认路径为 ./conda2. 修改config文件...

2019-08-20 10:13:24 14274

原创 HTTP 413 curl 22 The requested URL returned error: 413 Request Entity Too Large

网上查到了一些解决方案,都没能解决问题,有用ssh解决的,但看着太麻烦,查到一个比较简单的解决方案;进入要提交的文件;显示隐藏文件,进入 .git文件夹,打开config文件修改url原始的url = https://gitee.com/用户名/仓名.git改为:url = [email protected]:/用户名/仓名.git (此处为码云的)github的为:url...

2019-08-13 09:40:36 1700 1

原创 docker 查询ip

先进入所在的docker容器安装ifconfig, apt install net-tools输入命令ifconfig, 即可获得相应的ip地址

2019-08-08 17:57:21 700

转载 rnn梯度弥散 LSTM无梯度弥散

之前看过,现在突然想不起,真的是好记性不如烂笔头,希望大家在看的时候能够拿笔和纸跟着推导一遍,加深理解。转自:https://zhuanlan.zhihu.com/p/28687529 https://zhuanlan.zhihu.com/p/287494441.RNN梯度弥散和爆炸的原因经典的RNN结构如下图所示:假设我们的时间序列只有三段, S0S_0S0​为给定值,神经元没有...

2019-08-02 15:51:15 297 1

原创 deepin安装docker

在安装docker的时候遇到不少问题,还好最终圆满解决。不小心将终端关掉了,为了复现安装过程中的问题,将安装好的卸载了,重新来。1. 卸载原有的docker网上多有的方法:sudo apt-get remove docker docker-engine然后并不好使,使用下列命令卸载sudo apt-get remove docker docker-engine docker-ce do...

2019-07-31 18:09:19 1296 6

转载 deepin文件管理器(super+e)被替换为vscode

转自:https://www.jianshu.com/p/b91f87fa41ab在终端输入gio mime inode/directory dde-file-manager.desktop

2019-07-23 14:31:46 683 2

原创 BERT学习资料

BERT大火时,一直忙于将产品落地,现在终于有时间详细系统地学习了。主要梳理一下学习顺序及清晰的解读文章。阅读BERT论文之前,建议先学习Transfomer,对应论文为:Attention Is All You Need,另附一篇通俗易懂的解读文章:BERT大火却不懂Transformer?读这一篇就够了肯定要读一下BERT的论文:BERT: Pre-training of Deep Bi...

2019-07-22 09:44:11 481

原创 c++ string转char*

C++提供了两个函数:c_str()和data()当处理较短的string时,直接调用这两个函数没有出现问题,调用格式如下:std::string str = "Hello Word";char* p1 = str.c_str();char* p2 = str.data();但是,当字符串比较长时,采用这两个函数,转换出来的char* 出现乱码,采用下边这种方式是完全没问题的,故记录在...

2019-07-10 13:27:09 18199 3

原创 c++使用torch的问题

问题:unqualified-id before ‘)’ token const std::vector& slots() const {原因:QFile和‘torch/script"兼容的问题解决方案:将使用QFile和torch的封装到两个类中

2019-07-03 14:08:22 2191

原创 问答系统论文小记

此部分慢慢添加Improving Response Selection in Multi-turn Dialogue Systems by Incorporating Domain Knowledge发表时间:2018解决问题:基于检索的多轮对话答案选择基本思想:将上下文和答案分别采用GRU进行编码,为了选出对上下文有贡献的答案中的词以及选出对答案有贡献的上下文语句,因此加入了注意力...

2019-06-18 16:29:30 803 4

原创 few-shot learning几篇论文

Prototypical Networks for Few-shot Learning论文链接:https://arxiv.org/abs/1703.05175开源代码:https://github.com/jakesnell/prototypical-networks发表时间:2017年6月该论文属于metric_based论文中心思想:经过神经网络学会一个映射,将所有样本映射到同一...

2019-05-23 10:46:04 2221

原创 Learning to Compare: Relation Network for Few-Shot Learning论文笔记

前言在语音问答系统领域,很多时候,每一个类所拥有的训练数据量是很少的,采用传统的分类器进行训练,很可能出现overfitting,为了应对这种问题,最近要研究一下小样本学习。关于小样本学习的基本概念,可以参看https://www.chainnews.com/articles/650132977783.htm,该综述中还提到了每种类型算法中的典型算法。论文评价论文链接:https://ar...

2019-05-22 13:37:44 2008 6

进阶CNN对cifar10分类

进阶CNN对cifar10分类;两层卷积,两层池化,两层norm,两层全连接层

2017-08-23

TensorFlow实现AGNSAE

TensorFlow实现加性高斯噪声自编码器

2017-08-16

TensorFlow实现多感知机

TensorFlow实现多感知机,对Mnist的测试精度达到98%

2017-08-16

TensorFlow实现CNN

测试可行,对Mnist的最高检测精度为99.25%

2017-08-16

tensorflow-1.1.0rc2-cp35-cp35m-win_amd64.whl

tensorflow-1.1.0rc2-cp35-cp35m-win_amd64.whl

2017-08-02

UFLDL stackedas_exercise 编程答案

UFLDL stackedas_exercise 编程答案

2017-07-06

UFLDL self-taught 自我学习编程答案

UFLDL self-taught 自我学习编程答案

2017-06-29

UFLDL softmax回归编程答案

UFLDL softmax回归编程答案,程序均已用矩阵操作,最终的分类精度为92.640%

2017-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除