python之lmdb

最新推荐文章于 2024-05-10 09:39:06 发布

阿尔发go

最新推荐文章于 2024-05-10 09:39:06 发布

阅读量5.1k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/zhayushui/article/details/103896519

版权

python 专栏收录该内容

21 篇文章 1 订阅

订阅专栏

文章目录

lmdb介绍
安装lmdb
使用

lmdb介绍

参考

LMDB的全称是Lightning Memory-Mapped Database(快如闪电的内存映射数据库)
它的文件结构简单，包含一个数据文件和一个锁文件
LMDB文件可以同时由多个进程打开，具有极高的数据存取速度，访问简单，不需要运行单独的数据库管理进程，只要在访问数据的代码里引用LMDB库，访问时给文件路径即可。
让系统访问大量小文件的开销很大，而LMDB使用内存映射的方式访问文件，使得文件内寻址的开销非常小，使用指针运算就能实现。
数据库单文件还能减少数据集复制/传输过程的开销。

安装lmdb

conda install -c conda-forge python-lmdb
# 以下方法安装会导致import lmdb报错 No module named 'lmdb'
#pip install lmdb
#conda install lmdb

使用

# -*- coding: utf-8 -*-
#python=3.6
import lmdb

def lmdb_create():
    # 如果train文件夹下没有data.mbd或lock.mdb文件，则会生成一个空的，如果有，不会覆盖
    # map_size定义最大储存容量，单位是kb，以下定义1TB容量
    env = lmdb.open("./train",map_size=1000)
    env.close()

def lmdb_using():
    env = lmdb.open("./train", map_size=int(1e9)) 

    # 参数write设置为True才可以写入
    txn = env.begin(write=True)  

    # 添加数据和键值 
    txn.put(key = '1'.encode(), value = 'aaa'.encode())
    txn.put(key = '2'.encode(), value = 'bbb'.encode()) 
    txn.put(key = '3'.encode(), value = 'ccc'.encode()) 

    # 通过键值删除数据 
    txn.delete(key = '1'.encode()) 

    # 修改数据 
    txn.put(key = '3'.encode(), value = 'ddd'.encode()) 

    # 通过commit()函数提交更改 
    txn.commit() 
    env.close()

def lmdb_read():
    env = lmdb.Environment('./train') 
    #env = lmdb.open("./train")   # or

    txn = env.begin()  #write=False

    # get函数通过键值查询数据 
    print(txn.get('2'.encode()))

    # 通过cursor()遍历所有数据和键值 
    for key, value in txn.cursor(): 
        print (key, value) 

    print(txn.stat())
    print(txn.stat()['entries'])  #读取LMDB文件的样本数量

    # close
    env.close()

def main():
    # lmdb_create()
    # lmdb_using()
    lmdb_read()

# errors:
# 1. lmdb.MapFullError: mdb_put: MDB_MAP_FULL: Environment mapsize limit reached
# 解决方法： lmdb.open("./train", map_size=int(1e9)

# 2. TypeError: Won't implicitly convert Unicode to bytes; use .encode()
# 解决方法： TypeError:不会隐式地将Unicode转换为字节,对字符串部分，进行.encode()

if __name__ == '__main__':
    main()

获取LMDB文件的样本数量

阿尔发go

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
2
评论
python之lmdb

文章目录lmdb介绍安装lmdb使用lmdb介绍LMDB的全称是Lightning Memory-Mapped Database(快如闪电的内存映射数据库)它的文件结构简单，包含一个数据文件和一个锁文件LMDB文件可以同时由多个进程打开，具有极高的数据存取速度，访问简单，不需要运行单独的数据库管理进程，只要在访问数据的代码里引用LMDB库，访问时给文件路径即可。让系统访问大量小文件的开...
复制链接

扫一扫