文本检测识别数据集

1.中文数据集 CTW data(Chinese Text in the Wild) 清华大学与腾讯共同推出了中文自然文本数据集(Chinese Text in the Wild,CTW)——一个超大的街景图片中文文本数据集,为训练先进的深度学习模型奠定了基础。目前,该数据集包含 32,285...

2018-04-03 15:51:56

阅读数 5022

评论数 0

场景文字识别概述

1.概述点击打开链接2.相关论文15年的综述http://mclab.eic.hust.edu.cn/UpLoadFiles/Papers/FCS_TextSurvey_2015.pdf论文 Detecting Text in Natural Image with Connectionist Te...

2018-03-06 21:18:08

阅读数 769

评论数 0

Ubuntu系统下编译.so文件报错:undefined symbol: _Py_ZeroStruct

1.报错如下: ImportError: /home/yang/Documents/model/detect/PSENet-master/pse/adaptor.so: undefined symbol: _Py_ZeroStruct 一般来说是编译环境版本不对应的问题。 于是修改pse/i...

2019-04-16 11:17:03

阅读数 43

评论数 0

Ubuntu python2文件转python3文件

ubuntu安装完 python3 后,会自动添加2to3 的工具 使用如下命令可以获取到修改2到3的diff: 2to3 -f all -f idioms xxx.py -w 会生成 xxx.py.bak 即为python2的备份代码文件。 xxx.py 即为生成的python3文件。 ...

2019-03-31 20:58:17

阅读数 19

评论数 0

2019 人工智能领域AI相关比赛信息

1.ICDAR2019 ICDAR是专注于自然场景下图片文本检测与识别的一项比赛。 http://rrc.cvc.uab.es/ 2.天池大数据竞赛 https://tianchi.aliyun.com/competition/entrance/231685/introduction?sp...

2019-03-27 20:44:09

阅读数 32

评论数 0

使用Git上传代码到Github

1.安装软件Git 安装最新版本出现问题,于是安装Git-2.20.1-64-bit。 2.先clone git clone ..... 3.执行上传命令 git add . git commit -m "init" git push -u origin mast...

2019-03-26 13:20:04

阅读数 37

评论数 0

keras中使用内置模型语义分割上采样维度不匹配

1.卷积时要使用padding=same因此要修改原来的padding=valid x = conv2d_bn(img_input, 32, 3, strides=2, padding='same') 2.池化时卷积核大小修改为2而不是原来的3 branch_pool = layers....

2019-03-09 21:44:09

阅读数 29

评论数 0

keras 特征图可视化

import argparse import matplotlib.pyplot as plt import numpy as np from PIL import Image, ImageDraw from keras.preprocessing import image from keras....

2019-03-05 15:31:23

阅读数 125

评论数 0

Arbitrary-Oriented Scene Text Detection via Rotation Proposals 论文要点记录

在MSRA-TD500数据集提升结果如下图: 提升策略: a.文本区域上下文 b.扩增训练数据集 c.边界填充(保持图像原有比例) d.尺寸抖动 e.后处理

2019-03-03 11:27:09

阅读数 50

评论数 0

目标检测解决多尺度问题

相关链接 http://bbs.cvmart.net/topics/264/scale?from=groupmessage 1.针对小目标 Perceptual Generative Adversarial Networks for Small Object Detection   CVPR2...

2019-01-29 20:30:15

阅读数 575

评论数 0

12306 抢票软件使用记录

1.代码地址 https://github.com/pjialin/py12306 2.注意事项 a.需使用python3.6 b.下载包时使用python原始源 pip install --user -r requirements.txt -i https://pypi.python....

2019-01-22 16:57:24

阅读数 74

评论数 1

论文阅读笔记之Pyramid Attention Network for Semantic Segmentation

论文地址:https://arxiv.org/abs/1805.10180v1 摘要:本文利用全局上下文信息在语义分割中的影响提出了一个金字塔注意力网络(PAN)。 与现有的工作不同,我们结合注意机制和空间金字塔对像素级别的标签提取精确稠密特征,而不是复杂的空洞卷积(dilated convo...

2019-01-10 13:01:11

阅读数 131

评论数 0

人工智能重要比赛榜单网址

1.pascal voc http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?cls=mean&challengeid=11&compid=4 2.ICDAR 2015 http...

2019-01-09 16:39:42

阅读数 43

评论数 0

keras版本SSD

源代码地址:https://github.com/pierluigiferrari/ssd_keras 1.数据输入存储 object_detection_2d_data_generator.py 修改数据存储格式 整形改成浮点型(但意味着存储空间扩大2倍): hdf5_labels =...

2019-01-09 15:18:37

阅读数 196

评论数 0

文本检测评估代码

1.评估代码 评测接口来自ICDAR大赛:http://rrc.cvc.uab.es/?ch=4&com=mymethods&task=1 可下载离线代码:https://github.com/liuheng92/OCR_EVALUATION ...

2019-01-04 12:41:50

阅读数 168

评论数 0

python中numpy相关函数

1.np.linspace np.linspace(start=1,stop=10,num=50) 在区间[1,10]之间产生50个等差数列数字 2.expand_dims(a, axis) 就是在axis的那一个轴上把数据加上去,这个数据在axis这个轴的0位置。 例如原本为一维的2个...

2019-01-01 14:54:04

阅读数 61

评论数 0

keras 模型微调与迁移训练

1.只加载部分权重 assert os.path.exists(weights_path), 'Model weights not found (see "weights_path" variable in script).' f = h5py.File(w...

2018-12-26 17:14:12

阅读数 133

评论数 0

Keras与Tensorflow混用 报错Keras AttributeError: 'Tensor' object has no attribute '_keras_history'

第一种策略:将tensorflow tensor转keras tensor 1.索引操作转换 #转换前 x = self.x[:, :, :, :] #转换后 x=Lambda(lambda x: x[:, :, :, :])(self.x) 2.tf操作以及K操作转换 x=Lambd...

2018-12-21 19:41:21

阅读数 276

评论数 0

论文阅读笔记之Deformable ConvNets v2

摘要:可变形卷积网络的优越性能产生于它适应物体几何变化的能力。通过对自适应行为的实验,我们观察到虽然对其神经特征的空间支持比常规ConvNets更接近于对象结构,但是这种支持可能远远超出感兴趣区域,导致特征受不相关图像内容影响。为了解决这个问题,我们提出了可变形ConvNets的一种重构,通过增强...

2018-12-18 14:56:26

阅读数 58

评论数 0

论文阅读笔记之Deformable Convolutional Networks

论文地址:https://arxiv.org/abs/1703.06211 摘要:卷积神经网络的固定几何结构限制了模型对物体形变的建模能力,在本工作中,我们引入了两个新的模块来增强CNNs的形变建模能力,即可变形卷积和可变形RoI池。通过额外的偏移量参数增强空间位置采样能力,并从目标任务中学习偏...

2018-12-17 18:32:17

阅读数 51

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭