回忆一下之前的Categorical Data数据,是通过类似字典编码的方式存储了原始数据,降低了存储所需的空间,也就是说有的时候DataFrame里的数据未必就是原始数据,那么需要对原始数据,例如采集时设定了一些协议,1代表某某、2代表另一个事务或内容,那么当开发者得到这些协议后的编码,需要做一些数据上的变换,以便真实的反映数据本身,本章研究数据的转换,会介绍一些函数例如map、applymap等函数,将数据转换成其他的数据。
23.1 map函数
map函数可以将某列数据映射成其它数据,语法结构如下:
outerSeries.map(innerSeries)
调用map函数的Series即outerSeries其value可被括号里的形参innerSeries的值替换掉,替换规则是outerSeries的value和innerSeries的index进行匹配,即最后的结果是调用map的outerSeries的index和形参innerSeries的value。
import pandas as pd
oSeries = pd.Series(["a", "b", "c"], index = [2,3,1])
iSeries = pd.Series([100,200, 300], index = ["c","b","a"])
print oSeries
print iSeries
print oSeries.map(iSeries)
程序执行结果:
2 a
3