Python之如何读取数据?

本文介绍了Python中高效处理大数据的方法,包括使用pandas和datatable读取数据,通过parquet格式实现快速加载,以及Parquet的优势。还提到了Vaex和Spark DataFrame用于处理超大数据集,并给出了相关资源链接。
摘要由CSDN通过智能技术生成
1.pandas直接读取数据
import pandas as pd
train = pd.read_csv('../input/train.csv')
train.head()
2.导入大量数据,datatable
import datatable as dt

train_datatable = dt.fread('../input/train.csv'
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值