python数据处理：分列到行

南湖渔歌

已于 2022-08-03 10:13:55 修改

阅读量747

点赞数 1

文章标签： python 数据分析

于 2022-05-06 15:47:14 首次发布

本文链接：https://blog.csdn.net/weixin_44976611/article/details/124611952

版权

# 导入需要的包
import pandas as pd 
from datetime import datetime 

# 文件读取方式1：
def Course_duration(df):
    df.columns  = ['round_teacher','course_cnt'] # 修改字段列名
    # df.head()

    # 对round_teacher列进行拆分并转化为长序列
    df1 = df['round_teacher'].str.split('/',expand=True).stack()\
                             .reset_index(level =1,drop = True).rename('course_teacher_split') # 对Series命名

    # 将除了round_teacher的其他列组合成Dataframe

    df2 = df[[x for x in df.columns if x != 'round_teacher']] # if 条件筛选过滤字段

    # 根据索引值，将df2和df1进行匹配

    df_new = df2.join(df1) # 使用join语法，通过两个Series的索引进行拼接 → DataFrame
    # df_new.head()

    data = df_new.pivot_table(values= 'course_cnt',index = 'course_teacher_split', aggfunc='sum')

    # 导出处理后结果到指定文件：
    previous_month = int(datetime.now().strftime('%Y%m'))-1
    data.to_excel(f'C:/Users/DELL/Desktop/统计结果{previous_month}.xlsx')

# 统计结果202204.xlsx 没有该文档也会自动创建

if __name__=='__main__':
    
    # 读入数据
    excelpath = 'C:/Users/DELL/Desktop/AF-打赏数据(1).xlsx'
    df = pd.read_excel(excelpath) 
    
    # 调用函数,导出结果
    Course_duration(df)

南湖渔歌

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python数据处理：分列到行

# 导入需要的包import pandas as pd from datetime import datetime # 文件读取方式1：def Course_duration(df): df.columns = ['round_teacher','course_cnt'] # 修改字段列名 # df.head() # 对round_teacher列进行拆分并转化为长序列 df1 = df['round_teacher'].str.split('/',expand
复制链接

扫一扫