Python Melt函数:数据重塑利器
在数据分析的过程中,经常会遇到需要将数据从宽表重塑成长表或者反过来的情况。而Python中的melt函数提供了一种简单、快捷的方式来解决这个问题。
什么是Melt函数?
Melt函数是pandas库中的一个函数,其可以将DataFrame中的宽格式数据重塑为长格式。具体来说,就是将一些列转化为行,以便于数据的分析和可视化。该函数的定义如下:
DataFrame.melt(id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None)
其中参数含义如下:
- id_vars:需要保留的列,即不需要被转化为行的列,可以是列名称或者列索引。
- value_vars:需要被转化为行的列,可以是列名称或者列索引。
- var_name:被转化为行的列的名称,可以自定义。
- value_name:新列的名称,可以自定义。
- col_level:多层列索引时,具体操作在哪一层。
如何使用Melt函数?
下面我们通过一个简单的例子来演示Melt函数的使用。首先,我们构造一个包含课程成绩的DataFrame。
import pandas as pd
data = {
'姓名': ['小明', '小刚', '小红'],
'语文成绩': [86, 92, 88],
'数学成绩': [90, 89, 92],
'英语成绩': [91, 86, 90]
}
df = pd.DataFrame(data)
print(df