pandas.melt()使用介绍(宽表变长表)

本文介绍了如何使用Pandas的melt函数将宽格式数据集转换为长格式,以整合外部变量如价格、节假日和促销信息。通过实例演示了如何设置id_vars和value_vars参数,并自定义列名,以便于后续分析和建模。
摘要由CSDN通过智能技术生成

目前的数据集是每一行sales对应一条时间序列,这样一些外部变量,例如价格,节假日,甚至未来可能遇到的促销、人流量数据是无法直接加在上面的,所以我们需要将这种wide的宽表,变成长表

每一行代表的是某一家店某一个商品某一天的具体信息,包括销量,价格,节假日,促销等等。

下面是一个pandas melt函数convert wide to long的例子在这里插入图片描述

pandas.melt 使用参数

pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name=‘value’, col_level=None)

参数解释:

  • frame: 要处理的数据集。
  • id_vars: 不需要被转换的列名。
  • value_vars: 需要转换的列名,如果剩下的列全部都要转换,就不用写了。
  • var_name 和 value_name 是自定义设置对应的列名。
  • col_level: 如果列是 MultiIndex,则使用此级别。

例子:

>>>d = {'col1': ['a','a','a','b','b'], 
        'col2': [2,2,2,2,2],
        'col3':['c','c','c','d','d']}
>>>df = pd.DataFrame(data=d)
>>>df

在这里插入图片描述
1、设置 id_vars=[‘col2’] ,则不需要转换的列是 col2 。所以 col1 跟 col3 合并成了一列。

>>>pd.melt(df, id_vars=['col2'])

在这里插入图片描述
2、设置 id_vars = [‘col2’], value_vars = [‘col1’] , 则不需要转换的列是 col2 。需要转换的是 col1 列 ,拿 col3 就不受影响,不展示了。

pd.melt(df, id_vars=['col2'], value_vars=['col1'])

在这里插入图片描述
3、对修改后的列设置新列名。

pd.melt(df, id_vars=['col2'], value_vars=['col1'], var_name='hi', value_name='hello')

在这里插入图片描述

参考链接
[1] Pandas 的melt的使用 2018.4
[2] pandas行转列,列转行操作 2020.4

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值