Pandas
chaoqichaoluoe
Transform!
展开
-
python ThreadPool多线程
使用pandas.read_excel读取数据虽然比较方便,但是如果涉及excel文件过多时,读取数据速度会大大减慢,如果是从excel文件中在指定位置拿取部分数据,速度会更加慢,使用ThreadPool线程池可以适当加快数据读取速度。使用方法如下:def process(item): usecol = ['Unnamed: 6','Unnamed: 21','Unnamed: 7'] r_df = pd.read_excel(item,sheet_name ='Report',useco原创 2021-02-08 22:08:42 · 355 阅读 · 1 评论 -
Pandas groupby 自定义聚合函数
# 自定义聚合函数,# n.i.o 出现次数0 -> 0# n.i.o 出现次数1 -> 进一步判断# n.i.o 出现次数大于2 -> 2# 此函数需进一步扩展,出现次数大于2的,需要根据计划频率,判断是否在一次连续测试内def peak_peak(arr,df): # 判断arr的series值中是否包含'n.i.o' x = list(arr).count('n.i.O.') # 只包含一个,条件放行 if x == 1: r原创 2021-02-08 21:45:20 · 2288 阅读 · 0 评论