绝望的乐园

在哪个世界都是一样的.....人们都是笑着,哭着,然后死去.....

论文阅读: Character Region Awareness for Text Detection (CRAFT)

简介 论文链接:https://arxiv.org/abs/1904.01941 这篇论文的主要是解决文本检测的问题,思路是利用分割的方法,与图像分割有些不同的是,CRAFT不是对整个图像进行像素级分类,而是做了回归,它有两个分支,一个是目标是字符的中心的概率(这里用概率可能不是很准确,或许说是距...

2019-06-02 16:28:16

阅读数 16

评论数 0

tfrecord读写数据

tfrecord 的读写数据是真的麻烦,各种不方便,而且还有些坑,不太想讲这个东西,所以这里就打算写个简单的读写模板,可以作为参考。 其实写tfrecord本质只有三个类型: bytes,int64,float。所以我们要保存的数据就转成这三种类型就行了。 另外,这几种类型的数据都是一个list的...

2019-05-17 15:12:49

阅读数 27

评论数 0

对 Spatial Transformer Networks(空间变换网络) 的思考

论文地址: https://arxiv.org/abs/1506.02025 这几天看了下stn,大概写一写吧。说实话,这个东西思想倒是蛮有意思的,但是实际用起来效果不好说,至少在我想要应用的场景下效果不怎么样。 这里先写论文的思路,再写一下我做的一些实验与相应的思考。 STN 目标 我们知道,C...

2019-05-07 14:55:57

阅读数 63

评论数 0

pytorch如何在测试的时候启用dropout

我们知道,dropout一般都在训练的时候使用,那么测试的时候如何也开启dropout呢? 在pytorch中,网络有train和eval两种模式,在train模式下,dropout和batch normalization会生效,而val模式下,dropout不生效,bn固定参数。 想要在测试的时...

2019-04-06 09:51:23

阅读数 253

评论数 0

LSTM 详解

这篇文章打算讲一下LSTM,虽然这类文章已经很多了,但以前刚开始看的时候还是一知半解,有一些细节没有搞清楚,我打算借这篇文章好好梳理一下。 前言 在许多讲LSTM的文章中,都会出现下面这个图。 Alt text 说实话,这个图确实很清晰明了(对于懂的人来说)。在很多文章中我都发现了这样的问题,有...

2019-03-17 22:10:57

阅读数 119

评论数 0

解决 THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=405 error=11 : invalid argument

如题,原因是显卡用的RTX 2080Ti,CUDA就要装10以上,这个时候pytorch不能直接用pip装,要这样: pip3 install https://download.pytorch.org/whl/cu100/torch-1.0.0-cp36-cp36m-linux_x86_64.wh...

2019-01-31 16:26:37

阅读数 2851

评论数 2

Ubuntu18.04 + RTX 2080 Ti 安装NVIDIA显卡驱动的一些坑

记录一下踩到的坑。 一般情况下,驱动装好了,可以用下面的命令来查看显卡状况: nvidia-smi 当成功弹出下面的内容的时候,说明驱动装成功了: 安装驱动的方法我这里就不写了,可以参考一下: https://blog.csdn.net/weixin_40859436/article/deta...

2019-01-30 17:17:59

阅读数 3716

评论数 3

python3 判断是否为中文,打印范围内字符

有的时候需要判断某个字符是不是中文(英文,日文……),但是不可能吧所有字符都列出来,看字符是不是在里面。这个时候可以根据unicode编码的范围来判断是哪个语言,比如,中文的范围是4e00~9fa5。其他字符的范围可以从这里面找一下:https://unicode-table.com/cn/blo...

2019-01-28 13:38:51

阅读数 791

评论数 0

GAN——生成对抗网络详解

GAN的诞生 在讲GAN的内容之前想先讲一下GAN诞生的故事。GAN的创造者是Ian Goodfellow,有一天为了庆祝一个朋友Razvan Pascanu获得了博士学位,他和一些朋友在蒙特利尔一家酒吧嗨。他们开始讨论一个新的研究方向,通过数学的方法确定图片内容,大概意思是把图片都喂给机器,通过...

2019-01-27 15:23:52

阅读数 156

评论数 0

简单理解信息量、散度、交叉熵

信息论 顾名思义,信息论是研究信息的一门学科,不过在这篇文章里,只讨论一些简单的概念。 信息量 这里的信息量和“这句话信息量很大啊”的信息量有些像,但还是有区别的。 信息论 顾名思义,信息论是研究信息的一门学科,不过在这篇文章里,只讨论一些简单的概念。 信息量 这里的信息量和“这句话信息量很大啊”...

2019-01-05 12:47:52

阅读数 184

评论数 0

Unet学习笔记

最近在看Unet,记录一下。 论文地址 https://arxiv.org/pdf/1505.04597.pdf 网络结构 图上画的还是很清晰的,但是对于不了解Unet结构的人来说,可能还是有一些不清楚的地方。我这里结合我看的时候的疑问,来讲一下Unet的结构的一些问题。 可以看到,输入是57...

2018-12-18 23:22:35

阅读数 3420

评论数 20

使用mkldnn为cpu运行网络加速

最近要在用crnn,跑的pytorch模型,本来在gpu跑的好好的,但是后来由于各种原因,需要在cpu上跑,才发现cpu上跑的是真的慢,后来发现了mkldnn这个东西,这是intel开发的开源项目,就是针对cpu上运行神经网络做了一些并行优化。 用了以后,大概速度快了7,8倍吧,效果还是比较明显的...

2018-11-22 09:01:14

阅读数 1626

评论数 3

TextRank学习笔记

TextRank起源与PageRank TextRank的灵感来源于大名鼎鼎的PageRank算法,这是一个用作网页重要度排序的算法。 并且,这个算法也是基于图的,每个网页可以看作是一个图中的结点,如果网页A能够跳转到网页B,那么则有一条A->B的有向边。这样,我们就可以构造...

2018-11-04 10:38:41

阅读数 1521

评论数 0

随笔——关于贝叶斯定理

贝叶斯定理是一个很经典的定理,虽然公式很简单,套用起来也很方便,但是还是缺乏一个直观的sense, 似乎很有道理却说不出来,这是一件很难受的事情,今天打算好好聊一聊贝叶斯定理,看看是否可以建立一个直观的感觉。 其实,画图是一个很好理解数学公式的方法,如果各种公式都能变成一个简单的图像存在人的大脑里...

2018-09-23 17:53:40

阅读数 324

评论数 0

目标检测——细读YOLO V1

Yolo(You Only Look Once)是一个end-to-end的目标检测算法。作者在论文中提出,人类的视觉系统是快速和准确的, 人们瞥一眼图像,立即知道图像中的物体是什么,它们在哪里以及它们如何相互作用。而对于Rcnn系列的方法,都是需要先找到有可能有物体的框(anchor box),...

2018-09-08 14:11:13

阅读数 242

评论数 0

FasterRcnn中boundingbox regression的一些理解

在fasterrcnn中,做框的回归,有三个输入,anchor,预测的框,groundtruth的框。一个框的表示,使用中心点(x,y)(x,y)(x, y),和框的宽高(w,h)(w,h)(w,h)表示。 那么这个回归的loss怎么算呢?首先看下图: 其中: 绿框:ground tru...

2018-08-30 11:39:38

阅读数 609

评论数 6

关于Faster-Rcnn中的AnchorBox的一些理解

最近在看faster-rcnn的源码,写一写笔记~ 之前看论文的时候,anchorbox这个东西,虽然大概意思是理解了,但是还是有很多细节没想明白,之前读代码的时候又有了更深的理解。 首先,faster-rcnn在计算anchorbox之前大概是下面这几步: 为了更方便理解,我列出了实际...

2018-04-14 17:53:59

阅读数 8252

评论数 10

图片转tfrecord格式的优化

前两天在用一个开源代码的时候,发现他把数据转tfrecord以后特别大,本来硬盘空间就有些紧张,这下更不够了。看了一下转完以后的大小,是原始数据的9、10倍,这就有些夸张了。之前用tfrecord的时候没有特别注意这个事情,这次看到了还是研究一下。 方案1: 这是原来代码里的写法,为了简便,就...

2018-04-14 13:37:30

阅读数 1412

评论数 2

如何生成FSNS数据集结构的tfrecord数据

想要用一下attention ocr,github如下: https://github.com/tensorflow/models/tree/master/research/attention_ocr 发现这里面并没有生成数据的样例代码,只能用fsns的格式,如果想要用自己的数据集要生成一个和...

2018-01-13 15:38:28

阅读数 904

评论数 0

卷积神经网络的参数计算

前言 这篇文章会简单写一下卷积神经网络上参数的计算方法,然后计算各个常见神经网络的参数。一个是加强对网络结构的了解,另一方面对网络参数的量级有一个大概的认识,也可以当作备忘录,免得想知道的时候还要再算。 参数计算方法 全连接的参数计算就不说了,比较简单。 首先,简单说一下卷积网络的参数...

2018-01-08 22:39:12

阅读数 23611

评论数 13

提示
确定要删除当前文章?
取消 删除
关闭
关闭