Windows 64位操作系统下 c++ 生成 LMDB库文件

在Windows 64位操作系统下 生成 LMDB库文件

样本数据量10万+,大小几百G

存储生LMDB库文件用于训练深度模型

几个要点:

(1)LMDB库文件中的所有记录,均根据唯一键key存储(注意:唯一 ,即不能有重复)

如果不唯一,则具有相同key值的数据在写入时会覆盖之前的已写入的数据

(2)创建LMDB

         scoped_ptr<db::DB> train_db(db::GetDB("lmdb"));//以智能指针的方式创建db::DB类型的对象 db  用字符串指定后端为"lmdb"
        train_db->Open(db_name_train, db::NEW);//db_name_train文件夹下创建并打开lmdb的操作环境 
        scoped_ptr<db::Transaction> txn(train_db->NewTransaction()); //创建lmdb文件的操作句柄  

(3)  LMDB库大小可设定

const size_t LMDB_MAP_SIZE = 1099511627776;  // 1 TB

(4)训练样本要进行Shuffle

random_shuffle(vector.begin (), vector.end() );

参考:

http://www.pythonheidong.com/blog/article/137351/ 如何将数据附加到现有的LMDB?

https://www.jb51.net/article/142985.htm Python建库

http://www.cocoachina.com/articles/96887 Windows下最终的数据库大小与插入的数据量

https://www.ctolib.com/lmdbxx.html  C++11 wrapper for LMDB

https://blog.csdn.net/bi_diu1368/article/details/90731861 shuffle很重要

https://blog.csdn.net/qq_41855420/article/details/90743114 哪些容器可以shuffle

https://stackoverflow.com/questions/34822152/how-to-append-data-to-existing-lmdb?r=SearchResults how to append data to existing LMDB?  如果追加样本都是一个新类,无法shuffle

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值