python read_csv 分块多线程读_python - 读取大CSV并将其拆分为较小的块 - 堆栈内存溢出...

我正在尝试使用python读取和分析大型csv文件(11.5 GB)。 然后使用Power BI在其周围创建一些视觉效果。 但是,每当我运行任何命令行甚至更改Power BI中的数据框时,每次更改之间大约需要20-30分钟。

列标题之一是DeviceID 。 我想将大CSV拆分为多个csv文件,以便每个文件都具有属于一个唯一DeviceID值的数据。

当前,单个Full.csv文件中的数据Full.csv如下所示:

DeviceID AreaName Longitude Latitude

12311 Dubai 55.55431 25.45631

12311 Dubai 55.55432 25.45634

12311 Dubai 55.55433 25.45637

12311 Dubai 55.55431 25.45621

12309 Dubai 55.55427 25.45627

12309 Dubai 55.55436 25.45655

12412 Dubai 55.55441 25.45657

12412 Dubai 55.55442 25.45656

运行代码后,单个Full.csv文件应产生3个csv文件: 12311.csv , 12309.csv和12412.csv ,每个文件看起来都像这样:

DeviceID AreaName Longitude Latitude

12311 Dubai 55.55431 25.45631

12311 Dubai 55.55432 25.45634

12311 Dubai 55.55433 25.45637

12311 Dubai 55.55431 25.45621

De

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值