6. 50万行取10万行

最新推荐文章于 2024-10-05 08:57:27 发布

阿凡......

最新推荐文章于 2024-10-05 08:57:27 发布

阅读量71

点赞数

文章标签： python

本文链接：https://blog.csdn.net/P589513523111111/article/details/125305531

版权

本文探讨了大数据处理的最新趋势，重点介绍了Hadoop和Spark在大规模数据处理中的应用。同时，分析了云计算在支持大数据处理中的关键作用，特别是AWS、Google Cloud和阿里云等主流云服务商的解决方案。文章还涉及了数据安全和隐私保护的重要性，提出了相关技术和策略。

摘要由CSDN通过智能技术生成

fa=open('C:\\Users\\dell\\Desktop\\CVUSAtrain.txt', 'r') 
fb=open('C:\\Users\\dell\\Desktop\\newCVUSAtrain.txt', 'w+')
fa_col=len(fa.readlines())
print(f"CVUSAtrain.txt中有{fa_col}行")
n=fa_col//100000
print(f"每{n}行取一行")
fa.close()
fa=open('C:\\Users\\dell\\Desktop\\CVUSAtrain.txt', 'r') 
i=0
for line in fa:
    if i%n == 0:
        fb.write(line)
    i=i+1
fa.close()
fb.close()
fc=open('C:\\Users\\dell\\Desktop\\newCVUSAtrain.txt', 'r')
print(f"newCVUSAtrain.txt中有{len(fc.readlines())}行")
fc.close()

关注博主即可阅读全文