6. 50万行取10万行

本文探讨了大数据处理的最新趋势,重点介绍了Hadoop和Spark在大规模数据处理中的应用。同时,分析了云计算在支持大数据处理中的关键作用,特别是AWS、Google Cloud和阿里云等主流云服务商的解决方案。文章还涉及了数据安全和隐私保护的重要性,提出了相关技术和策略。
摘要由CSDN通过智能技术生成
fa=open('C:\\Users\\dell\\Desktop\\CVUSAtrain.txt', 'r') 
fb=open('C:\\Users\\dell\\Desktop\\newCVUSAtrain.txt', 'w+')
fa_col=len(fa.readlines())
print(f"CVUSAtrain.txt中有{fa_col}行")
n=fa_col//100000
print(f"每{n}行取一行")
fa.close()
fa=open('C:\\Users\\dell\\Desktop\\CVUSAtrain.txt', 'r') 
i=0
for line in fa:
    if i%n == 0:
        fb.write(line)
    i=i+1
fa.close()
fb.close()
fc=open('C:\\Users\\dell\\Desktop\\newCVUSAtrain.txt', 'r')
print(f"newCVUSAtrain.txt中有{len(fc.readlines())}行")
fc.close()
   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值