python读取大文件csv_python – 获取csv文件的最后10000行

最新推荐文章于 2023-01-20 11:57:30 发布

weixin_39713335

最新推荐文章于 2023-01-20 11:57:30 发布

阅读量499

点赞数

文章标签： python读取大文件csv

您可以先使用以下方法计算文件大小：

size = sum(1 for l in open('file.csv'))

然后使用范围有的分类：

df = pd.read_csv('file.csv', skiprows=range(1, size - 10000))

编辑

正如@ivan_pozdeev提到的解决方案,你需要通过文件两次.我试图用pandas读取整个文件,然后使用tail方法,但这种方法比较慢.

示例数据帧：

pd.DataFrame(np.random.randn(1000000,3), columns=list('abc')).to_csv('file.csv')

定时

def f1():

size = sum(1 for l in open('file.csv'))

return pd.read_csv('file.csv', skiprows=range(1, size - 10000))

def f2():

return pd.read_csv('file.csv').tail(10000)

In [10]: %timeit f1()

1 loop, best of 3: 1.8 s per loop

In [11]: %timeit f2()

1 loop, best of 3: 1.94 s per loop

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39713335

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

用python实现json文件的读写

Tiramisu_z的博客

09-10

789

读取json文件： #读取json文件 import json with open("test.json",mode="r",encoding="utf-8") as f: #以读取的方式打开json文件 json_f=json.load(f) #读取的json文件格式为字符串格式，要转换为字典格式，方便取值 print(f"json_f的内容：{json_f}") print(f"json_f的类型：{type(json_f)}") print(json_f["key

python读取大文件csv_python – 从csv文件的每一列获取最大值

weixin_39746241的博客

11-24

1564

有人帮我解决以下问题.我自己尝试过,我也附上了解决方案.我使用了2-d列表,但我想要一个没有2-d列表的不同解决方案,它应该更加pythonic.pl建议我你们中的任何一个人都有其他办法.Q)考虑CSV文件中自1990年以来每月给出的N个公司的股价.文件格式如下,第一行为标题.年,月,公司A,公司B,公司C,………….公司N.1990年1月10日,15日,20日,……….,501990年2月10日...

参与评论您还未登录，请先登录后发表或查看评论

python如何读取百万级的csv文件-Python如何读取数据量百万级的CSV文件数据?

weixin_37988176的博客

10-29

1815

是时候安利我们的开源库：Mars。Mars DataFrame 可以用来加速 pandas 执行，即使在单机。而代码几乎无需改动。以下代码都是在我的笔记本上跑的。任务一：只读取 CSV 文件pandas：In [1]: import pandas as pdIn [2]: %time df = pd.read_csv('ratings.csv')CPU times: user 4.75 s, sy...

python读取csv最后一行_用Python读取CSV文件行的最后一个非空单元格

weixin_34678198的博客

02-04

2398

我正在尝试使用python获取csv文件每行中最后一个值的列表。这些行都有五个单元格,但它们的填充不一致。有的有一个、两个、三个或四个牢房,其余的都是空的。以下是csv文件的摘录:art and entertainment,books and literature,,,art and entertainment,celebrity fan and gossip,,,art and entertai...

python 倒数_【IT专家】python实现文件倒数N行读取

weixin_39670464的博客

12-09

624

python对百万行csv数据处理

weixin_40451593的博客

04-10

1396

总结一下用python做毕设的经验** （之前没有学过python，所以：单纯记录成长，与君共享！）功能说明：对一个百万行数据量的csv文件进行特征提取（应该是这么个说法），害，就是根据其中的值构建一个新的矩阵。最开始的错误编程操作：直接导入pandas库，完了以后read_csv + 一堆while,for,if开搞，结果就是读取效率巨低！！！改进思路： 1.只提取有用的列属性进行操作...

csv_file.rar_csv_csv文件_python_python 读写 excel_python处理csv数据

09-23

读取CSV文件通常使用`csv.reader()`函数，而写入则使用`csv.writer()`函数。例如： ```python import csv # 读取CSV文件 with open('data.csv', 'r') as file: reader = csv.reader(file) for row in ...

python读取csv文件表头_Python读取CSV文件

weixin_39538536的博客

11-29

3053

1.CSV简介格式，用以存储表格数据，包括数字或者字符，下面主要介绍csv文件读取和写入两种方式2. 读取CSV文件Iterable:是一个行迭代器Dialect:默认的读取方式是以excel的形式去读下面是准备的csv格式的文档，我们来用python读取读取操作：读取结果如下：['class', 'name', 'sex', 'height', 'year']['1', 'wangtao', '...

python如何读取csv文件macbook_python读取CSV文件

weixin_39812577的博客

11-22

810

python中有一个读写csv文件的包，直接import csv即可。利用这个python包可以很方便对csv文件进行操作，一些简单的用法如下。1. 读文件csv_reader = csv.reader(open('data.file', encoding='utf-8'))for row incsv_reader:print(row)例如有如下的文件输出结果如下['0.093700','0.13...

mnist手写数据集测试集10000个csv格式

10-23

mnist手写数据集测试集10000个csv格式，方便广大网友学习

用python数据处理csv

学渣日记

07-16

524

文章目录从csv读取数据向csv写入数据数据描述操作行列建立新的列筛选符合条件块排序从csv读取数据 import pandas as pd df=pd.read_csv("地址") # 选取行 rows=df[0:3] rows # 选取列 cols=df[['1','2']] cols.head() # head展示前五行(表头除外） # 选取块 df.ix[0:3,['1','2']] # 三行两列的数据 # 数据分割 df2=df[80:90][['1','2']] 向csv写入数据 df.to

python如何读取csv文件某几行某几列_使用python只读取csv文件中的某些行

weixin_39975486的博客

11-21

1638

正如其他人所说，最明显的解决方案是使用熊猫读csv！该方法有一个名为skiprows的参数：skiprows:list-like，int或callable，可选文件开始时要跳过的行号（0索引）或要跳过的行数（int）。在如果可调用，将根据行索引计算可调用函数，如果应跳过该行，则返回True；否则返回False。一个有效的可调用参数的例子是[0，2]中的lambda x:x。你可以这样做：impor...

pythonpandas读取csv文件最后一行_使用numpy/pandas读取Python中CSV文件的最后N行

weixin_39624389的博客

12-19

1414

在一个10行的小测试文件中，我尝试了两种方法-解析整个过程并选择最后N行，而不是加载所有行，但只解析最后N行：In [1025]: timeit np.genfromtxt('stack38704949.txt',delimiter=',')[-5:]1000 loops, best of 3: 741 µs per loopIn [1026]: %%timeit...: with open('s...

pd.read_csv()当列数太多的时候不换行显示

漫步量化

11-13

2020

pd.read_csv()当列数太多的时候不换行显示将文件读入python，当列数太多的时候，会自动将不同的列分开显示，多有不便，用一个小参数就可以解决。 pd.set_option('expand_frame_repr',False) ...

用pandas的read_csv函数读取csv文件某一列，每间隔5个数读取一个值，写出代码