【数据分析】Python——从一个CSV文件中随机选取m行数据

CSV文件一共有m(4017277)条数据,随机取出n(10万)条数据,保存值另外CSV一个文件。

注意:数据类型是DataFrame

import random
from random import randint
 
oldf=open('thp_zbwd_bing_01_Del_abs50.csv','r',encoding='UTF-8')
newf=open('thp_zbwd_bing_01_Del_abs50_Random.csv','w',encoding='UTF-8')
n = 0
# sample(x,y)函数的作用是从序列x中,随机选择y个不重复的元素
resultList = random.sample(range(0,4017277),100000)

lines=oldf.readlines()
for i in resultList:
    newf.write(lines[i])
    
oldf.close()
newf.close()

 

转载于:https://www.cnblogs.com/ITCSJ/p/11411149.html

  • 11
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值