python 读取redis数据后转为dataframe格式数据

最新推荐文章于 2022-08-19 14:47:07 发布

呆萌的代Ma

最新推荐文章于 2022-08-19 14:47:07 发布

阅读量1.1k

点赞数

分类专栏：大数据 python 文章标签： redis python

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/121438917

版权

python 同时被 2 个专栏收录

593 篇文章 40 订阅

订阅专栏

大数据

51 篇文章 6 订阅

订阅专栏

思路

读取大规模数据需要借助pipeline，速度会更快
在读取后，需要删除掉异常读取的数据，pipeline不会报错，但是会返回一个type(line).__name__ == "ResponseError"的结果
redis读取的数据是byte格式，需要整理为str格式

示例

import redis
import pandas as pd
from tqdm import tqdm

pool = redis.ConnectionPool(host='127.0.0.1', db=5)  # 实现一个连接池，这里选择第5个db
redis_cli = redis.Redis(connection_pool=pool)  # 创建连接redis的客户端

# 这里添加一些数据哈：
redis_cli.hmset("value1", {"k1": "v1", "k2": "v2", "k3": "v3"})
redis_cli.expire('value1', 30)  # 30秒后从redis中删除
redis_cli.hmset("value2", {"k1": "v1", "k2": "v2", "k3": "v3"})
redis_cli.expire('value2', 30)  # 30秒后从redis中删除
redis_cli.hmset("value3", {"k1": "v1", "k2": "v2", "k3": "v3"})
redis_cli.expire('value3', 30)  # 30秒后从redis中删除
redis_cli.set('奇奇怪怪的key', '奇奇怪怪的value')
redis_cli.expire('奇奇怪怪的key', 30)  # 30秒后从redis中删除

# 开始取数据
pipe = redis_cli.pipeline()  # 定义一个管道，加速提取
key_list = []
keys = redis_cli.keys()  # 得到所有的key
for key in keys:
    key_list.append(key)
    pipe.hgetall(key)  # 把pipe需要执行的操作
    # 可以调试使用redis_cli.hgetall(随便一个key)，测试一下看看是不是想要的结果
value_list = pipe.execute(raise_on_error=False)

# 开始删除读取异常的数据
drop_index = []
for i, line in tqdm(enumerate(value_list)):
    if type(line).__name__ == "ResponseError":  # 把错误的内容剔除出去
        drop_index.append(i)
        continue
    else:
        value_list[i] = {k.decode('utf8'): v.decode('utf8') for k, v in line.items()}  # 把byte的数据转为str数据
[value_list.pop(index) for index in drop_index]

# 直接构造dataframe
df = pd.DataFrame(value_list)
print('a')

呆萌的代Ma

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
python 读取redis数据后转为dataframe格式数据

思路读取大规模数据需要借助pipeline，速度会更快在读取后，需要删除掉异常读取的数据，pipeline不会报错，但是会返回一个type(line).__name__ == "ResponseError"的结果redis读取的数据是byte格式，需要整理为str格式示例import redisimport pandas as pdfrom tqdm import tqdmpool = redis.ConnectionPool(host='127.0.0.1', db=5) # 实现
复制链接

扫一扫