fa=open('C:\\Users\\dell\\Desktop\\CVUSAtrain.txt', 'r')
fb=open('C:\\Users\\dell\\Desktop\\newCVUSAtrain.txt', 'w+')
fa_col=len(fa.readlines())
print(f"CVUSAtrain.txt中有{fa_col}行")
n=fa_col//100000
print(f"每{n}行取一行")
fa.close()
fa=open('C:\\Users\\dell\\Desktop\\CVUSAtrain.txt', 'r')
i=0
for line in fa:
if i%n == 0:
fb.write(line)
i=i+1
fa.close()
fb.close()
fc=open('C:\\Users\\dell\\Desktop\\newCVUSAtrain.txt', 'r')
print(f"newCVUSAtrain.txt中有{len(fc.readlines())}行")
fc.close()
6. 50万行取10万行
最新推荐文章于 2024-10-05 08:57:27 发布
本文探讨了大数据处理的最新趋势,重点介绍了Hadoop和Spark在大规模数据处理中的应用。同时,分析了云计算在支持大数据处理中的关键作用,特别是AWS、Google Cloud和阿里云等主流云服务商的解决方案。文章还涉及了数据安全和隐私保护的重要性,提出了相关技术和策略。
摘要由CSDN通过智能技术生成