2019年08月_农夫山泉2号

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 conda install -c pytorch pytorch-nightly torchvision cudatoolkit=9.0

conda install -c pytorch pytorch-nightly torchvision cudatoolkit=9.0选择不同版本的cudatoolkit

2019-08-30 18:42:54 5189 1

原创 mmdetection源码阅读记录

本来应该先介绍整体框架，然后再是其中的一些实现细节。这里因为要先读源码，所以一边看，一边记录，最后在总结一下。阅读记录从配置文件(py, yaml…)中导入设置参数用sys.path.insert(0,‘/path’)，进入config文件夹采用pytorch自带的import_modulesys.path.pop(0)，删掉刚才的config文件夹...

2019-08-29 17:43:50 306

原创安装mmdetection

1. 第一次尝试官方要求：Linux (Windows is not officially supported)Python 3.5+ (Python 2 is not supported)PyTorch 1.1 or higherCUDA 9.0 or higherNCCL 2GCC(G++) 4.9 or highermmcv本机环境：pytorch 1.1cuda 9....

2019-08-29 15:05:28 886 2

原创深度学习样本类别不平衡

转载自目标检测小tricks之样本不均衡处理

2019-08-28 14:11:17 403

官方：Adds a persistent buffer to the module.This is typically used to register a buffer that should not to be considered a model parameter. For example, BatchNorm’s running_mean is not a parameter, b...

2019-08-23 17:24:04 11182

原创各种比赛的方案汇总

深度学习是一个烧钱的运动。文章目录1. ECCV2018 |百度视觉团队斩获 ECCV Google AI 目标检测竞赛冠军，获奖方案全解读1. ECCV2018 |百度视觉团队斩获 ECCV Google AI 目标检测竞赛冠军，获奖方案全解读百度视觉团队在 Google AI Open Images-Object Detection Track 目标检测任务中斩获第一，存在挑战与传统...

2019-08-23 11:47:44 293

原创模型压缩Distiller学习

摘要在神经网络模型中，通过正则化或剪枝来诱导稀疏性是压缩网络的一种方法(量化是另一种方法)。稀疏神经网络具有速度快、体积小和能量大的优点...

2019-08-23 09:17:23 889 7

原创 pytorch crossentropy为nan

**问题：**用pytorch的crossentropy做损失函数的时候，迭代几步之后loss为nan。交叉熵损失函数的具体为：loss = -(x*ln(z)+(1-x)*ln(1-z)) z = softmax(pred_x)这样当z为0/1时会出现loss为nan的情况参考解决方案在pred_x上加一个很小的量，如1e-10loss = crossentropy(o...

2019-08-22 10:27:55 5952

原创 TypeError: can't convert np.ndarray of type numpy.object_. The only supported types are: float64, fl

pytorch报错TypeError: can’t convert np.ndarray of type numpy.object_. The only supported types are: float64, float32, float16, int64, int32, int16, int8, and uint8.源码src_seq = torch.LongTensor(src_se...

2019-08-20 19:05:32 7438

转载 -bash: /bin/mv: Argument list too long解决

在ubuntu中移动50000张图片的图片的时候遇到如下问题：-bash: /bin/mv: Argument list too long解决用find命令，注意：结束符不能省“ ;”find sourcePath/ -name "*.txt" -exec mv {} targetPath/ \;#orfind sourcePath/ -type f -exec mv {} ta...

2019-08-20 15:52:00 10309

原创论文推荐——Levenshtein Transformer

Levenshtein Transformer这个模型基于 Transformer，运算量自然不小；但是进行序列变换的方法是插入和删除，正好适合于源序列和目标序列差别不大（即 Levenshtein Distance 较小）的情况，也即模型的能力和任务所需要的能力恰好匹配。（当然该模型也可以用于源序列和目标序列差别较大的情况，不过这时候采用这种不断编辑源序列的方法不一定值当就是了。从文章的实验...

2019-08-16 16:56:35 1931

原创滴滴云GPU服务器

滴滴云GPU服务器，每个小时3块多，应该是国内最便宜的了。但是宽带费用太贵了。临时用用就可以了。

2019-08-15 18:18:17 650 1

原创 ICDAR2019结果

链接

2019-08-15 17:46:26 2326

原创用attention如何做不定长字符的识别？

如题，请教！

2019-08-14 17:43:24 929 3

原创千万不要用efficientnet做bone net

前面有写过一篇文章convolution backbone network——EfficientNet解读,说efficientnet很好，然而最近用他做bonenet的时候，发现太消耗GPU显存了，efficient_b4在1080ti测试都out of memorey 了，所以不推荐用，还是用用resnet50吧最后上一张efficient的结果对比图，看看就好了。...

2019-08-14 08:41:41 8492 10

原创 pytorch模型(nn.Module)初始化的影响

pytorch在定义模型的时候，是继承（nn.Module）类，一般是我们在初始化的时候，将不同的模块都定义好，在forward函数中进行调用，有的时候，在初始化的时候，会初始化一些没有用到的模块，而没有删除，或者在forward函数中没有用到，这样会影响网络的收敛速度。举个例子第一种：没有将self.attention和self.decoder删掉，forward中也没有使用这样收敛速度会变...

2019-08-12 13:33:31 3018 8

原创深度学习模型学习率的设定——LSTM/Transformer

针对小的数据集，比如：几百，几千，小一万等，可以用简单的模型，自己用简单的卷积和池化串行搭就行了，比如lenet-5，不用上VGG或resnet，这样收敛速度更快。LSTM的学习速率为：0.001就可以收敛，而Transformer的速率要为0.0001才行...

2019-08-12 11:13:41 11712

转载 python实现全角半角的相互转换

转载自： https://www.cnblogs.com/kaituorensheng/p/3554571.html在自然语言处理过程中，全角、半角的的不一致会导致信息抽取不一致，因此需要统一。转换说明全角半角转换说明有规律（不含空格）：全角字符unicode编码从65281~65374 （十六进制 0xFF01 ~ 0xFF5E）半角字符unicode编码从33~126 （十六进制 ...

2019-08-08 09:47:31 345

原创中文检测与识别数据集整理

文章目录1. 检测2. 识别3. 人工生成检测的数据集是：中文文字在一张图片上；识别的话是：已经crop出来了文本行的情况。1. 检测A Large Chinese Text Dataset in the Wild腾讯地图中获取的图片，有单个字符的标注。MTWI 2018 挑战赛二：网络图像的文本检测阿里天池文本检测大赛，主要是互联网收集和人工合成的图片，但是标注文字区域的八个点，...

2019-08-06 11:08:15 2401

原创 ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification论文下载

这是一篇华科白翔老师课题组做OCR识别的一篇论文，主要思路是：矫正网络+识别网络，做一个端到端的训练。IEEE的论文下载要付费。坑。下载链接here...

2019-08-02 15:35:37 796

原创文字识别的主要问题

不同样式的字体竖直的文本特殊的字符，如符号等曝光或被遮蔽低分辨率标注有问题的

2019-08-01 16:39:04 810

原创 Omnidirectional Scene Text Detection with Sequential-free Box Discretizati——文本检测论文阅读

文章目录1. 简介2. 相关工作3. 方法1. 简介EAST的问题：问题是，找到一个合适的排序规则来避免由点的序列引起的学习混淆(LC)并非易事基于这一问题，本文提出了一个简单的但是有效的方法称为无顺序盒离散化(SBD)，它可以将边界框参数化为键边缘。主要观点是找到与标签无关的至少四个不变点(例如，对角线的平均中心点和交点)我们可以用这些不变点来求反向推导边界框坐标。实验部分显示比现...

2019-08-01 14:49:29 1081 2

hisi3516dv300, 用IVE将yuv420数据转换成bgr，包含源代码和测试数据

hisi3516dv300, 用IVE将yuv420数据转换成bgr，包含源代码和测试数据。

2022-12-07

armv7白皮书:ARM Architecture Reference Manual ARMv7-A and ARMv7-R edition

armv7白皮书，包含指令集等

2021-04-07

armv8的白皮书:Arm Architecture Reference Manual Armv8, for Armv8-A architecture

armv8的白皮书，为官方文档包含架构讲解，neon函数，指令集等。文件为百度网盘下载链接。

2021-04-07

download_scannet.zip

scannet数据下载的python脚本。

2021-01-27

pybind11 python调用c++拓展的例子

采用pybind11模块来实现python调用c++程序的两个例子，具体可以看：文章：https://blog.csdn.net/u011622208/article/details/111302047

2020-12-16

tensorrt5.1双线性上采样插件

针对tensorrt5.1实现的双线性上采样插件，插件实测无误。如果用nvidia的gpu，在推理的时候，采用tensorrt进行加速是一个很好的选择，虽然tensorrt没有开源。

2020-11-17

opencv_cuda.tar.gz

利用cuda加速opencv图像处理的例子——交换mat的r，b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速，使用过程需要管理CPU与GPU之间的数据传输，内核函数调用参数的设置，内核函数的优化等。优点是处理过程受控于用户，用户可以实现更多的并行加速处理操作。

2020-11-10

cuda向量加法cmake编译

采用cmake编译cuda向量加法。　在大量的C/C++的项目中都使用CMake来进行项目的管理，而CUDA又是很流行的并行计算库，利用CMake来构建CUDA项目就显得很有必要了，而且项目中使用的CMakeLists.txt基本框架一致。

2020-11-10

AMD-APP-SDK-v2.8-Windows-64.exe的安装文件

64位windows amd平台的opencl安装软件。安装之后sample在：C:\Users\xx\Documents\AMD APP\

2020-08-28

faiss_install.zip

Faiss是Facebook AI团队开源的针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意：编译器不同，可能无法使用。

2020-08-06

Hi3519A编译好的YOLOV3 demo百度网盘下载链接

Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的，这就让人很不开心，而且华为的人给的资料很乱，其次，很多的demo都是支持Hi3559A的，还没入坑的，推荐选Hi3559A进行开发。

2020-04-28

python多文件夹/文件夹依赖关系制作pip安装包

将文件夹打包成pip安装包，网络上大多是单个文件夹，且不存在文件（同文件夹/不同文件夹）直接的相互调用。使用环境有限。该包尝试将多个文件夹/文件之间存在相互调用的项目打包成一个pip包。

2020-02-27

ocr_annotation-master.zip

采用python-flask框架开发图像标注工具,主要思路是在标注的过程中先调用百度/阿里等免费的api进行标注，并进行人工的验证或目标矩形框的修正，同时支持单张图片多个目标的标注。整理想法很简单，但是实现起来还是很麻烦的。大概用了2周的时间（而且是在开源项目上修改来的）

2020-01-07

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification.pdf

ASTER_An_Attentional_Scene_Text_Recognizer_with_Flexible_Rectification的论文pdf

2019-08-02

pig_coco.py

我们一般使用的数据格式是voc2007的数据格式，有时我们也需要用coco数据格式，这种格式一般以json格式存储，那么如将voc2007格式的数据转成coco数据格式呢？这是python的代码实现，只用改路径就好。

2019-07-03

支持向量机线性可分matlab程序

采用matlab自带的quadprog（）函数对支持向量机模型进行求解。整个文件夹包含测试用数据集，可运行。

2018-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

怡宝2号