Pandas中的数据重塑(reshape)功能
Pandas中的数据重塑(reshape)功能
引言
Pandas 是 python 中常用的数据分析软件库,它提供了 DataFrames 和 Series 的工具,这使得 numpy 和 matplotlib 可以更加便捷地读取转换数据。
数据重塑表示转换一个表格或者向量的结构,使其适合于进一步的分析。 Pandas 拥有一些其他软件不具备的重塑功能,这对初学者来说可能会比较棘手。
本文中我将举例说明 Pandas 中一些常用的重塑函数,并结合图表进行阐述。
pivot
pivot函数用于创建一个新的派生表,该函数有三个参数:index, columns和values。你需要在原始表中指定这三个参数所对定的列名,接下来pivot函数会创建一个新的表格,其中行索引和列索引都是唯一标示值,表格中的数值由原始表中参数value对应的数据所表示。
是不是感觉有点难以理解呢?看完下面这个例子你就明白了,假设给定下面这个表格:
其中 item 表示商品名称,USD 表示商品的美元价格,EU 表示欧元价格,CType 表示每个客户对应的类别。
下述代码片段用于创建 DataFrame,需要注意的是本文中所有的代码片段均需要导入以下模块:
from collections import OrderedDict
from pandas import DataFrame
import pandas as pd
import numpy as np
table = OrderDict((
("Item",['Item0','Item0','Item1','Item1']),
("CType",['Gold','Bronze','Gold','Silver']),
("USD",['1$','2$','3$','4$']),
("EU",['1
Pandas中的数据重塑(reshape)功能相关教程