自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (15)
  • 收藏
  • 关注

原创 conda install -c pytorch pytorch-nightly torchvision cudatoolkit=9.0

conda install -c pytorch pytorch-nightly torchvision cudatoolkit=9.0选择不同版本的cudatoolkit

2019-08-30 18:42:54 5189 1

原创 mmdetection源码阅读记录

本来应该先介绍整体框架,然后再是其中的一些实现细节。这里因为要先读源码,所以一边看,一边记录,最后在总结一下。阅读记录从配置文件(py, yaml…)中导入设置参数用sys.path.insert(0,‘/path’),进入config文件夹采用pytorch自带的import_modulesys.path.pop(0),删掉刚才的config文件夹...

2019-08-29 17:43:50 306

原创 安装mmdetection

1. 第一次尝试官方要求:Linux (Windows is not officially supported)Python 3.5+ (Python 2 is not supported)PyTorch 1.1 or higherCUDA 9.0 or higherNCCL 2GCC(G++) 4.9 or highermmcv本机环境:pytorch 1.1cuda 9....

2019-08-29 15:05:28 886 2

原创 深度学习样本类别不平衡

转载自目标检测小tricks之样本不均衡处理

2019-08-28 14:11:17 403

原创 pytorch register_buffer的作用

官方:Adds a persistent buffer to the module.This is typically used to register a buffer that should not to be considered a model parameter. For example, BatchNorm’s running_mean is not a parameter, b...

2019-08-23 17:24:04 11182

原创 各种比赛的方案汇总

深度学习是一个烧钱的运动。文章目录1. ECCV2018 |百度视觉团队斩获 ECCV Google AI 目标检测竞赛冠军,获奖方案全解读1. ECCV2018 |百度视觉团队斩获 ECCV Google AI 目标检测竞赛冠军,获奖方案全解读百度视觉团队在 Google AI Open Images-Object Detection Track 目标检测任务中斩获第一,存在挑战与传统...

2019-08-23 11:47:44 293

原创 模型压缩Distiller学习

摘要在神经网络模型中,通过正则化或剪枝来诱导稀疏性是压缩网络的一种方法(量化是另一种方法)。稀疏神经网络具有速度快、体积小和能量大的优点...

2019-08-23 09:17:23 889 7

原创 pytorch crossentropy为nan

**问题:**用pytorch的crossentropy做损失函数的时候,迭代几步之后loss为nan。交叉熵损失函数的具体为:loss = -(x*ln(z)+(1-x)*ln(1-z)) z = softmax(pred_x)这样当z为0/1时会出现loss为nan的情况参考解决方案在pred_x上加一个很小的量,如1e-10loss = crossentropy(o...

2019-08-22 10:27:55 5952

原创 TypeError: can't convert np.ndarray of type numpy.object_. The only supported types are: float64, fl

pytorch报错TypeError: can’t convert np.ndarray of type numpy.object_. The only supported types are: float64, float32, float16, int64, int32, int16, int8, and uint8.源码src_seq = torch.LongTensor(src_se...

2019-08-20 19:05:32 7438

转载 -bash: /bin/mv: Argument list too long解决

在ubuntu中移动50000张图片的图片的时候遇到如下问题:-bash: /bin/mv: Argument list too long解决用find命令,注意:结束符不能省“ ;”find sourcePath/ -name "*.txt" -exec mv {} targetPath/ \;#orfind sourcePath/ -type f -exec mv {} ta...

2019-08-20 15:52:00 10309

原创 论文推荐——Levenshtein Transformer

Levenshtein Transformer这个模型基于 Transformer,运算量自然不小;但是进行序列变换的方法是插入和删除,正好适合于源序列和目标序列差别不大(即 Levenshtein Distance 较小)的情况,也即模型的能力和任务所需要的能力恰好匹配。(当然该模型也可以用于源序列和目标序列差别较大的情况,不过这时候采用这种不断编辑源序列的方法不一定值当就是了。从文章的实验...

2019-08-16 16:56:35 1931

原创 滴滴云GPU服务器

滴滴云GPU服务器,每个小时3块多,应该是国内最便宜的了。但是宽带费用太贵了。临时用用就可以了。

2019-08-15 18:18:17 650 1

原创 ICDAR2019结果

链接

2019-08-15 17:46:26 2326

原创 用attention如何做不定长字符的识别?

如题,请教!

2019-08-14 17:43:24 929 3

原创 千万不要用efficientnet做bone net

前面有写过一篇文章convolution backbone network——EfficientNet解读,说efficientnet很好,然而最近用他做bonenet的时候,发现太消耗GPU显存了,efficient_b4在1080ti测试都out of memorey 了,所以不推荐用,还是用用resnet50吧最后上一张efficient的结果对比图,看看就好了。...

2019-08-14 08:41:41 8492 10

原创 pytorch模型(nn.Module)初始化的影响

pytorch在定义模型的时候,是继承(nn.Module)类,一般是我们在初始化的时候,将不同的模块都定义好,在forward函数中进行调用,有的时候,在初始化的时候,会初始化一些没有用到的模块,而没有删除,或者在forward函数中没有用到,这样会影响网络的收敛速度。举个例子第一种:没有将self.attention和self.decoder删掉,forward中也没有使用这样收敛速度会变...

2019-08-12 13:33:31 3018 8

原创 深度学习模型学习率的设定——LSTM/Transformer

针对小的数据集,比如:几百,几千,小一万等,可以用简单的模型,自己用简单的卷积和池化串行搭就行了,比如lenet-5,不用上VGG或resnet,这样收敛速度更快。LSTM的学习速率为:0.001就可以收敛,而Transformer的速率要为0.0001才行...

2019-08-12 11:13:41 11712

转载 python实现全角半角的相互转换

转载自: https://www.cnblogs.com/kaituorensheng/p/3554571.html在自然语言处理过程中,全角、半角的的不一致会导致信息抽取不一致,因此需要统一。转换说明全角半角转换说明有规律(不含空格):全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)半角字符unicode编码从33~126 (十六进制 ...

2019-08-08 09:47:31 345

原创 中文检测与识别数据集整理

文章目录1. 检测2. 识别3. 人工生成检测的数据集是:中文文字在一张图片上;识别的话是:已经crop出来了文本行的情况。1. 检测A Large Chinese Text Dataset in the Wild腾讯地图中获取的图片,有单个字符的标注。MTWI 2018 挑战赛二:网络图像的文本检测阿里天池文本检测大赛,主要是互联网收集和人工合成的图片,但是标注文字区域的八个点,...

2019-08-06 11:08:15 2401

原创 ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification论文下载

这是一篇华科白翔老师课题组做OCR识别的一篇论文,主要思路是:矫正网络+识别网络,做一个端到端的训练。IEEE的论文下载要付费。坑。下载链接here...

2019-08-02 15:35:37 796

原创 文字识别的主要问题

不同样式的字体竖直的文本特殊的字符,如符号等曝光或被遮蔽低分辨率标注有问题的

2019-08-01 16:39:04 810

原创 Omnidirectional Scene Text Detection with Sequential-free Box Discretizati——文本检测论文阅读

文章目录1. 简介2. 相关工作3. 方法1. 简介EAST的问题:问题是,找到一个合适的排序规则来避免由点的序列引起的学习混淆(LC)并非易事基于这一问题,本文提出了一个简单的但是有效的方法称为无顺序盒离散化(SBD),它可以将边界框参数化为键边缘。主要观点是找到与标签无关的至少四个不变点(例如,对角线的平均中心点和交点)我们可以用这些不变点来求反向推导边界框坐标。实验部分显示比现...

2019-08-01 14:49:29 1081 2

hisi3516dv300, 用IVE将yuv420数据转换成bgr,包含源代码和测试数据

hisi3516dv300, 用IVE将yuv420数据转换成bgr,包含源代码和测试数据。

2022-12-07

armv7白皮书:ARM Architecture Reference Manual ARMv7-A and ARMv7-R edition

armv7白皮书,包含指令集等

2021-04-07

armv8的白皮书:Arm Architecture Reference Manual Armv8, for Armv8-A architecture

armv8的白皮书,为官方文档包含架构讲解,neon函数,指令集等。文件为百度网盘下载链接。

2021-04-07

download_scannet.zip

scannet数据下载的python脚本。

2021-01-27

pybind11 python调用c++拓展的例子

采用pybind11模块来实现python调用c++程序的两个例子,具体可以看:文章:https://blog.csdn.net/u011622208/article/details/111302047

2020-12-16

tensorrt5.1双线性上采样插件

针对tensorrt5.1实现的双线性上采样插件,插件实测无误。如果用nvidia的gpu,在推理的时候,采用tensorrt进行加速是一个很好的选择,虽然tensorrt没有开源。

2020-11-17

opencv_cuda.tar.gz

利用cuda加速opencv图像处理的例子——交换mat的r,b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速,使用过程需要管理CPU与GPU之间的数据传输,内核函数调用参数的设置,内核函数的优化等。优点是处理过程受控于用户,用户可以实现更多的并行加速处理操作。

2020-11-10

cuda向量加法cmake编译

采用cmake编译cuda向量加法。 在大量的C/C++的项目中都使用CMake来进行项目的管理,而CUDA又是很流行的并行计算库,利用CMake来构建CUDA项目就显得很有必要了,而且项目中使用的CMakeLists.txt基本框架一致。

2020-11-10

AMD-APP-SDK-v2.8-Windows-64.exe的安装文件

64位windows amd平台的opencl安装软件。安装之后sample在:C:\Users\xx\Documents\AMD APP\

2020-08-28

faiss_install.zip

Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意:编译器不同,可能无法使用。

2020-08-06

Hi3519A编译好的YOLOV3 demo百度网盘下载链接

Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的,这就让人很不开心,而且华为的人给的资料很乱,其次,很多的demo都是支持Hi3559A的,还没入坑的,推荐选Hi3559A进行开发。

2020-04-28

python多文件夹/文件夹依赖关系制作pip安装包

将文件夹打包成pip安装包,网络上大多是单个文件夹,且不存在文件(同文件夹/不同文件夹)直接的相互调用。使用环境有限。该包尝试将多个文件夹/文件之间存在相互调用的项目打包成一个pip包。

2020-02-27

ocr_annotation-master.zip

采用python-flask框架开发图像标注工具,主要思路是在标注的过程中先调用百度/阿里等免费的api进行标注,并进行人工的验证或目标矩形框的修正,同时支持单张图片多个目标的标注。整理想法很简单,但是实现起来还是很麻烦的。大概用了2周的时间(而且是在开源项目上修改来的)

2020-01-07

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification.pdf

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification的论文pdf

2019-08-02

pig_coco.py

我们一般使用的数据格式是voc2007的数据格式,有时我们也需要用coco数据格式,这种格式一般以json格式存储,那么如将voc2007格式的数据转成coco数据格式呢?这是python的代码实现,只用改路径就好。

2019-07-03

支持向量机线性可分matlab程序

采用matlab自带的quadprog()函数对支持向量机模型进行求解。整个文件夹包含测试用数据集,可运行。

2018-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除