勤劳的凌菲-CSDN博客

原创 pytorch模型转为tensorrt engine的通用流程

安装onnxsim库。

2023-08-09 10:04:41 506

原创 tensorrt官方int8量化方法汇总

int8量化对小目标检测影响较大；int8量化相比fp16量化推理时间并不会节省一半，需实测；当fp16推理时间满足要求时，请采用fp16量化；

2023-08-08 15:38:53 1220 2

原创模型与计算平台

说明：部分内容摘自参考文献，如有侵权，联系删除。

2023-07-14 13:26:38 450

训练集上最大边长：ultralytics/yolo/utils/loss.py（此为8.0.117版本位置，前期版本位置不太一样，找到训练的loss函数即可），在loss函数中加入打印，即以下代码中的print。分析：dfl loss是检测框和真实框比较相近时（即在真实框的某个相近范围内），loss就会很小，个人理解是一种软标签，而我们平时用的box loss是硬标签，此时要加大box loss在loss中的权重。将self.reg_max设置为1，即不采用dfl loss，查看检测框是否正常；

2023-07-11 10:47:49 1831

原创 Bytetrack简记

说明：本文是根据代码对bytetrack算法的大致过程做记录。

2023-04-26 13:14:49 185

原创 conda的极速安装包mamba

在装torch和torvision时不建议使用pip，pip安装不能解决环境依赖的问题，而conda可以，但是conda安装包时，速度很慢，因此推荐conda的急速安装包mamba。方式1：conda安装。

2023-04-11 16:00:44 1338 2

原创使用ubuntu-drivers devices查找nvidia driver安装避坑

作为服务器使用的ubuntu系统，通常可以采用apt install安装显卡驱动。如果上述命令，显示有问题，可重启电脑，再nvidia-smi。选择想要安装的驱动版本进行安装。

2023-04-11 15:10:31 3395 3

原创 ubuntu cpp工程环境安装与编译

文章目录1. cmake及依赖安装2.cmake-gui安装3. 编译安装opencv3.1 下载opencv源码3.2 解压安装包3.3 cmake-gui设置及编译3.4 终端编译4. cpp IDE安装1. cmake及依赖安装sudo apt install cmakesudo apt install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavform

2021-07-21 17:49:33 636 2

原创 tensorrt+opencv c++工程编译的问题

opencv编译请点我问题1 CMakeLists.txt的写法cmake_minimum_required(VERSION 3.10)set(CMAKE_CXX_STANDARD 14)set(CMAKE_CXX_STANDARD_REQUIRED TRUE)set(CMAKE_MODULE_PATH "${CMAKE_SOURCE_DIR}" ${CMAKE_MODULE_PATH})set(CMAKE_INCLUDE_CURRENT_DIR ON)set(CMAKE_AUTOMOC O

2021-07-21 17:45:43 1091 3

原创 opencv+libtorch c++工程问题及解决方案

问题1：CMakeLists设置cmake_minimum_required(VERSION 3.17)project(enhance)set(CMAKE_INCLUDE_CURRENT_DIR ON)set(CMAKE_AUTOMOC ON)set(BOOST_LIBRARYDIR "/usr/lib/x86_64-linux-gnu")find_package(Qt5Core)add_executable(${PROJECT_NAME} "main.cpp" xx.h xx.cpp x

2021-04-26 09:28:59 1049 3

原创 You Only Look One-level Feature（YOLOF）

paper codeMotivation目标检测中常用到特征金字塔（FPN），在各网络中证明FPN确实有效，通常认为其有效得益于两个方面：（1）多尺度特征融合：融合了多种高分辨率和低分辨率的特征获取到更好的特征表达；（2）分而治之：根据目标的大小在不同层进行目标检测。目标检测的网络结构可以分为三大部分：backbone、encoder、decoder，如下所示：对encoder设计如下结构Figure 1进行实验，验证FPN的有效性是得益于多特征融合还是分而治之通过实验发现SiMo作为enc

2021-03-23 16:08:12 403

原创 deepinV20 显卡驱动 cuda10.2+cudnn配置

前言因为deepin15.11无线网驱动有问题，导致内部资料传输很慢，因此在deepin v20出来之后，开始挖坑填坑。尽管官方给出了从15.11直接升级到V20版本的方案，试过后，发现显卡驱动有问题，新的也装不上，旧的也卸载不了。因此采用从头安装的方案，此间遇到不少坑，还好最后都解决了。deepin v20安装安装时花屏解决方案：在系统安装时，有一个选项，大致意思是安装20desktop(忘记截图，还挺长，这个是第一个选项)，此时选择第二个选项，就是后边带有（safe graphics

2020-09-18 16:17:59 2213

原创文字图像超分辨率论文笔记

TextSR: Content-Aware Text Super-Resolution Guided by Recognition论文链接：https://arxiv.org/abs/1909.07113代码：https://github.com/xieenze/TextSR网络结构：SRGAN网络的基础上加文字识别网络，文字识别网络采用的是ASTER；损失函数：1）SR采用的是VGG的感知损失以及对抗损失；2）文字感知损失如下：上图中蓝线是训练过程，红线是推理过程；训练：3种训练方

2020-09-10 11:41:13 1082

原创 RealSR算法汇总

RealSRNTIRE2020真实超分双赛道冠军；两阶段：1）自监督数据生成；2）监督SR超分；作者提出一种新的数据制作方案：统计模糊核与真实噪声分布并用于制作训练数据对；可以使得LR与真实世界图像处于同域，进而将提升图像超分的性能；作者提出一种真实世界超分模型以获得更好的感知效果真实世界超分的关键问题在于如何引入精确的降质模型以确保生成的LR图像与原始图像具有同域属性(比如噪声分布、模糊等)在实际场景，HR图像、模糊核和噪声均未知的。为更精确的估计降质模型，我们需要从图像中估计模糊核与噪声。

2020-07-30 13:14:12 3357

原创 MuCAN: Multi-Correspondence Aggregation Network for Video Super-Resolution论文笔记

论文链接：https://arxiv.org/abs/2007.11803代码：未公开ECCV2020前言当前VSR算法所存在的问题：1）通常采用光流来建立时间相关性，但是光流估计易有误，从而影响重建结果；2）VSR算法极少采用自然图像中本就存在的相似模式。之前的VSR算法对对齐和回归两个阶段单独建模，本文将VSR看作帧内和帧间集成任务。本文所依据的现象：连续帧具有相似内容；同一帧内不同位置具有相似内容。帧间相关性：为了验证作者的想法，实验设置：在MPI-Sintel Flow数据集上，用一.

2020-07-28 13:42:07 1178 1

原创图像超分辨率论文笔记

Real-World Super-Resolution via Kernel Estimation and Noise Injection论文链接：http://openaccess.thecvf.com/content_CVPRW_2020/papers/w31/Ji_RealWorld_SuperResolution_via_Kernel_Estimation_and_Noise_Injection_CVPRW_2020_paper.pdf代码：RealSRCVPR2020， NTIRE2020

2020-06-18 11:33:34 1414

原创视频超分辨率论文笔记

持续更新Deep SR-ITM: Joint Learning of Super-Resolution and Inverse Tone-Mapping for 4K UHD HDR Applications论文连接：https://arxiv.org/ftp/arxiv/papers/1904/1904.11176.pdf代码：https://github.com/sooyekim/Deep-SR-ITM （matlab）CVPR 2019 oral网络结构：初始图像分解为base l

2020-06-15 18:28:42 2418

原创行人检测几篇论文相关笔记

这部分内容会持续更新，比较难的论文会单独开篇博文讲解，相对比较简单的就只写概要记录在此篇博文中。PedHunter: Occlusion Robust Pedestrian Detector in Crowded Scenes链接：https://arxiv.org/abs/1909.06826代码：https://github.com/ChiCheng123/PedHunter（...

2020-01-17 11:51:03 694 2

原创 Double Anchor R-CNN for Human Detection in a Crowd论文笔记

论文链接：Double Anchor R-CNN for Human Detection in a Crowd论文题目表明该算法应用场景为拥挤人群的人体检测。一、摘要人体检测的难题：1）拥挤遮挡问题；2）后处理的NMS，很难确定阈值，太大会导致误检多，太小漏检较多，如图1所示；现象：相比于人体，头部特征更为明显，头和头之间的交叉肯定比人小很多；思想：将头部检测添加到人体检...

2020-01-15 13:46:04 1646

原创 CUDA ERROR: device-side assert triggered问题解决思路

这个问题很可能是代码有问题，先排查错误step1在environment variable中添加：CUDA_LAUNCH_BLOCKING=1这样更容易定位到出现问题的地方step2再排查报错附近的原因，就在报错附近。我今天处理NLP，出现该问题的原因是：词的索引> embedding层词量...

2020-01-10 16:06:57 11852 3

原创词向量相关总结

最近准备把词向量相关知识串一下，会持续更主要参考：https://zhuanlan.zhihu.com/p/95304317unigram模型：所有的词都是相互独立的P(w1,w2,...,wn)=∏i=1nP(wi)P(w_1,w_2,...,w_n)= \prod_{i=1}^n P(w_i)P(w1,w2,...,wn)=i=1∏nP(wi)bigram模型：每一个词...

2019-12-18 14:52:55 498

原创 ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs论文解读

发表时间：2015论文链接:https://arxiv.org/pdf/1512.05193.pdf开源代码：https://github.com/galsang/ABCNN (tensorflow) https://github.com/lsrock1/abcnn_pytorch (pytorch)代码语言：python适用: Answer Slection(AS) paraphra...

2019-11-26 15:15:44 686

原创关于loss不收敛的一些建议

之前训练网络时,会先编写学习率随训练epoch的增加而逐渐减低的函数,然后选取一个相对较大的学习率(一般从e-2量级开始),选取一个epoch能够接受的batchsize,如果loss稳定下降较快,则开始训练.从未体验过学习率和batchsize搭配之难.最近新看了一篇论文ABCNN(有空再细讲),采用开源的tensorflow工程训练一下,效果很好,因工程需要,开始将其移植到pytorch...

2019-11-20 10:45:16 9890 9

原创 Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_BAD_PARAM

在python上加载caffe 的网络时会报上述错误，解决方案如下1.在报错的相应层添加 engine: CAFFE结果：加载网络时没有报错，但是net.forward前向计算时，会报Check failed: status == CUDNN_STATUS_SUCCESS (8 vs. 0) CUDNN_STATUS_BAD_PARAM解决如下2.重新编译caffe源码编译时， US...

2019-10-22 11:21:04 763

原创 pycharm+Docker+GPU配置

要求pycharm为专业版；已经安装好docker、nvidia-docker2，此部分安装可参见博客deepin安装docker；cuda、cudnn安装好配置步骤：打开pycharm，点击File->Settings->Project Interpreter2. 点击add…，出现界面如下：3. 点击界面左侧的 Docker右侧界面Server: 点击...

2019-10-15 14:06:45 713

原创 FreeAnchor: Learning to Match Anchors for Visual Object Detection论文详解

问题在基于anchor的目标检测算法中，训练时，通常通过anchor和真实object 框之间的IoU来决定该anchor是否用来预测object （包括类别和位置），通常IoU超过某一阈值则认为该anchor为正例（即作为预测object ），小于某一阈值则认为该anchor为背景。本文的思想就是通过修改loss函数去除人工参与指定anchor的过程，使网络能够自主学习选择哪个anchor和真...

2019-09-18 20:16:57 1386 2

原创 Task-oriented Dialogue System for Automatic Diagnosis论文笔记

发表时间：2018论文链接:https://www.aclweb.org/anthology/P18-2033代码：https://github.com/LiuQL2/MedicalChatbot代码语言：python摘要本文构建了一个用于自动诊断的对话系统。首先，从线上医学论坛上病人的自述以及病人医生间的交谈中提取症状，从而构建数据集；然后，本文提出了用于自动诊断的任务型对话系统框...

2019-09-05 11:31:01 1263

原创 Convolutional Neural Network Architectures for Matching Natural Language Sentences论文笔记

发表时间：2015年论文链接：https://arxiv.org/abs/1503.03244v1代码链接：http://nlp.stanford.edu/˜socherr/classifyParaphrases.zip代码语言：matlab摘要较好的匹配算法能够同时为句子内部结构和句子间的交互信息建模。本文提出的模型通过逐层构图和合并充分表达句子的层次信息，而且能够在不同的层次捕捉...

2019-09-04 14:10:10 1252

原创修改conda安装虚拟环境路径

之前我采用conda安装虚拟环境时，都是安装到miniconda下的envs中，换了系统后，就一直安装到/home/XX/.conda/envs中，导致我编译一些项目报错，并且随着虚拟环境越来越多，会占用大量的系统盘，因此，我要将虚拟环境的默认路径给改掉。1.查看当前的环境输入以下命令conda info会出现可以看到虚拟环境的默认路径为 ./conda2. 修改config文件...

2019-08-20 10:13:24 14367

原创 HTTP 413 curl 22 The requested URL returned error: 413 Request Entity Too Large

网上查到了一些解决方案，都没能解决问题，有用ssh解决的，但看着太麻烦，查到一个比较简单的解决方案；进入要提交的文件；显示隐藏文件，进入 .git文件夹，打开config文件修改url原始的url = https://gitee.com/用户名/仓名.git改为：url = git@git.oschina.net:/用户名/仓名.git （此处为码云的）github的为：url...

2019-08-13 09:40:36 1713 1

原创 docker 查询ip

先进入所在的docker容器安装ifconfig, apt install net-tools输入命令ifconfig, 即可获得相应的ip地址

2019-08-08 17:57:21 707

转载 rnn梯度弥散 LSTM无梯度弥散

之前看过，现在突然想不起，真的是好记性不如烂笔头，希望大家在看的时候能够拿笔和纸跟着推导一遍，加深理解。转自：https://zhuanlan.zhihu.com/p/28687529 https://zhuanlan.zhihu.com/p/287494441.RNN梯度弥散和爆炸的原因经典的RNN结构如下图所示：假设我们的时间序列只有三段， S0S_0S0为给定值，神经元没有...

2019-08-02 15:51:15 307 1

原创 deepin安装docker

在安装docker的时候遇到不少问题，还好最终圆满解决。不小心将终端关掉了，为了复现安装过程中的问题，将安装好的卸载了，重新来。1. 卸载原有的docker网上多有的方法：sudo apt-get remove docker docker-engine然后并不好使，使用下列命令卸载sudo apt-get remove docker docker-engine docker-ce do...

2019-07-31 18:09:19 1319 6

转载 deepin文件管理器（super+e）被替换为vscode

转自：https://www.jianshu.com/p/b91f87fa41ab在终端输入gio mime inode/directory dde-file-manager.desktop

2019-07-23 14:31:46 697 2

原创 BERT学习资料

BERT大火时，一直忙于将产品落地，现在终于有时间详细系统地学习了。主要梳理一下学习顺序及清晰的解读文章。阅读BERT论文之前，建议先学习Transfomer，对应论文为：Attention Is All You Need，另附一篇通俗易懂的解读文章：BERT大火却不懂Transformer？读这一篇就够了肯定要读一下BERT的论文：BERT: Pre-training of Deep Bi...

2019-07-22 09:44:11 490

原创 c++ string转char*

C++提供了两个函数：c_str()和data()当处理较短的string时，直接调用这两个函数没有出现问题，调用格式如下：std::string str = "Hello Word"；char* p1 = str.c_str();char* p2 = str.data();但是，当字符串比较长时，采用这两个函数，转换出来的char* 出现乱码，采用下边这种方式是完全没问题的，故记录在...

2019-07-10 13:27:09 18241 3

原创 c++使用torch的问题

问题：unqualified-id before ‘)’ token const std::vector& slots() const {原因：QFile和‘torch/script"兼容的问题解决方案：将使用QFile和torch的封装到两个类中

2019-07-03 14:08:22 2210

原创问答系统论文小记

此部分慢慢添加Improving Response Selection in Multi-turn Dialogue Systems by Incorporating Domain Knowledge发表时间：2018解决问题：基于检索的多轮对话答案选择基本思想：将上下文和答案分别采用GRU进行编码，为了选出对上下文有贡献的答案中的词以及选出对答案有贡献的上下文语句，因此加入了注意力...

2019-06-18 16:29:30 818 4

原创 few-shot learning几篇论文

Prototypical Networks for Few-shot Learning论文链接：https://arxiv.org/abs/1703.05175开源代码：https://github.com/jakesnell/prototypical-networks发表时间：2017年6月该论文属于metric_based论文中心思想：经过神经网络学会一个映射，将所有样本映射到同一...

2019-05-23 10:46:04 2249

原创 Learning to Compare: Relation Network for Few-Shot Learning论文笔记

前言在语音问答系统领域，很多时候，每一个类所拥有的训练数据量是很少的，采用传统的分类器进行训练，很可能出现overfitting，为了应对这种问题，最近要研究一下小样本学习。关于小样本学习的基本概念，可以参看https://www.chainnews.com/articles/650132977783.htm，该综述中还提到了每种类型算法中的典型算法。论文评价论文链接：https://ar...

2019-05-22 13:37:44 2022 6

进阶CNN对cifar10分类

TensorFlow实现AGNSAE

TensorFlow实现多感知机

TensorFlow实现CNN

tensorflow-1.1.0rc2-cp35-cp35m-win_amd64.whl

UFLDL stackedas_exercise 编程答案

UFLDL self-taught 自我学习编程答案

UFLDL softmax回归编程答案

空空如也