- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 表格图像预处理(一)
所处理表格图像如图所示:(百度搜的图,只是为了尝试一下处理方法)主要处理流程就是:1.图像预处理:二值化图像2.提取表格信息:横纵线及交点3.去除表格:利用表格信息去除图中表格4.将剩下的非表格信息进行形态学处理,将文字区域按块分出5.最后我利用自己手头训练的识别模块重写内容到一张空白图上效果还行吧。。。。。...
2019-12-28 13:05:36 522 1
原创 文字背景有纹理情况下的预处理
很多时候纹理很影响识别效果,所以偶尔需要预处理一下,毕竟纹理的样本不好生成啊,样本不够训练的效果不好,只能这样了。主要思路就是:去除表格----去纹理----聚类招文字----提取文字区域生成结果 result = cv2.bilateralFilter(result, 5, 75, 75) #聚类提取浅色文字 criteria = (cv2.TER...
2019-12-25 16:22:39 151
原创 pytorch中attention的两种实现方式
class AttnDecoderRNN(nn.Module): def __init__(self, hidden_size, output_size, dropout_p=0.1, max_length=MAX_LENGTH): super(AttnDecoderRNN, self).__init__() self.hidden_size = hi...
2019-12-18 16:32:51 20986
转载 google-images-download 批量下载数量限制解决办法
google-images-download 用于批量下载图片google-images-download 是个 Python 脚本。一条命令,就完成 Google 图片搜索和批量下载功能。而且,这工具还跨平台运行,Linux, Windows 和 macOS 都支持。简直是懒人福音。首先,我们先指定图片要下载的位置,我把它指定到了「下载(Download)」这个文件夹:cd ~...
2019-12-16 18:06:38 2482 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人