python处理300万数据_用Python读取几十万行文本数据

最新推荐文章于 2021-12-22 19:26:53 发布

Cnh21198

最新推荐文章于 2021-12-22 19:26:53 发布

阅读量797

点赞数

文章标签： python处理300万数据

本文链接：https://blog.csdn.net/weixin_42208901/article/details/113658824

版权

我在使用python读取几十万行的文件中的数据，并构造字典，列表等数据结构时，再访问字典，列表时，一般都会出现内存不够的问题，然后只能循环读取几百行或者一定数量的行数来循环操作。 keyword_list=[line.strip() for line in open("keywords.txt",'r')]

#f1=open("part_wiki_vec.txt",'r')

f1=open("wiki_vectors.txt")

f2=open("result.txt",'w')

i=0

content=f1.readlines()

while i<1150:

for line in content[300*i:300*(i+1)]:

line=line.strip().split(' ')

if line[0] in keyword_list:

wordvec=' '.join(line)

print wordvec

f2.write(wordvec)

#print line

i+=1

我是这样读取的

应该还有很多好的方法，比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对聚米学院的支持。如果你想了解更多相关内容请查看下面相关链接

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cnh21198

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python处理300万数据_用Python读取几十万行文本数据

我在使用python读取几十万行的文件中的数据，并构造字典，列表等数据结构时，再访问字典，列表时，一般都会出现内存不够的问题，然后只能循环读取几百行或者一定数量的行数来循环操作。 keyword_list=[line.strip() for line in open("keywords.txt",'r')]#f1=open("part_wiki_vec.txt",'r')f1=open("wiki...
复制链接

扫一扫