python多进程读取mysql表

表数据超过百万级别时使用pandas读取数据速度过慢,如果仍然想用pandas读取,可以通过多进程提高效率。同时可以将常用数据保存为pkl文件,以便后续使用。
@主要代码实现

#按照表中的某字段将表划分为比较均匀的多个子集
#本例中需要读取的表中包含了城市字段,
#且涉及的城市包含了全国大部分城市,数据分布较为均匀,因此制作了一张省份城市配置表,将数据划分
#读取省份-城市配置表,获取城市列表
def get_division_list(db_connect, division_table):
    sql = 'select * from {};'.format(division_table)
    data = pd.read_sql(sql, con = db_connect)
    #省份列表
    province_list = data['province'].unique().tolist()
    #获取城市列表
    city_list = [
  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值