最近需要对多个excel中数万条数据进行随机抽样,采用python进行。
excel读取和写入使用openpyxl第三方库。
随机抽样使用random.sample函数。
(抽取遇到的最大问题是不知道如何读取指定一行,采取直接读取的rows=ws.rows
这样生成的是一个生成器对象,并不能写入,一直遇到提示错误
ValueError: Cells cannot be copied from other worksheets
最后采取自定义函数的方式,还是得单个单元格读取value,一行一行读出来。)
初学python,方法笨拙,如果各位有更好的处理方法,万望赐教。
代码:
import openpyxl
import random
#定义一个函数,获取excel指定行的数据。
def get_row_value(ws,row):
col_num=ws