python读取大文件csv_python – 获取csv文件的最后10000行

您可以先使用以下方法计算文件大小:

size = sum(1 for l in open('file.csv'))

然后使用范围有的分类:

df = pd.read_csv('file.csv', skiprows=range(1, size - 10000))

编辑

正如@ivan_pozdeev提到的解决方案,你需要通过文件两次.我试图用pandas读取整个文件,然后使用tail方法,但这种方法比较慢.

示例数据帧:

pd.DataFrame(np.random.randn(1000000,3), columns=list('abc')).to_csv('file.csv')

定时

def f1():

size = sum(1 for l in open('file.csv'))

return pd.read_csv('file.csv', skiprows=range(1, size - 10000))

def f2():

return pd.read_csv('file.csv').tail(10000)

In [10]: %timeit f1()

1 loop, best of 3: 1.8 s per loop

In [11]: %timeit f2()

1 loop, best of 3: 1.94 s per loop

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值