基于caffe和casiaHWDB手写体汉字库的LMDB数据准备

这篇博客介绍了如何利用CASIA HWDB手写汉字库,通过Caffe来构建LMDB数据集。首先,下载并解压数据库,然后将测试集和训练集进行重命名以匹配标签。接着,在Caffe项目目录下创建Jaylee文件夹,存放数据,并在其中创建run文件夹。使用特定的Python脚本生成标签文件和lmdb数据,涉及文件重命名、标签对应和图片尺寸调整。最后,通过convert_imageset命令生成train_lmdb和test_lmdb文件,完成数据准备。
摘要由CSDN通过智能技术生成

奋斗1.数据库下载:http://www.nlpr.ia.ac.cn/databases/handwriting/Home.html

奋斗2.字符库解压:先zip解压,再gnt解压:http://blog.csdn.net/zsjhxl/article/details/42294591

路径要进行改动,分测试集和训练集,桌面大小要够要有6GB大小,其余盘会出现编码问题

测试集属性(1241-1300共60项解压,花费半小时):

一共3755个文件夹,每个文件夹有59个png格式图,每张图大小5kb左右,共1.2G 

训练集属性(1001-1240共240项解压,花费1.5小时)

一共3755个文件夹,每个文件夹有约239个png格式图,每张图大小5kb左右,共4.8G左右 

附永久删除文件方法:
rm -rf 目录名字
-r 就是向下递归,管理有多少级目录,一并删除
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值