pandas几个有用的小技巧

最新推荐文章于 2024-05-15 01:36:01 发布

wangyundlut

最新推荐文章于 2024-05-15 01:36:01 发布

阅读量304

点赞数 1

分类专栏： Python 文章标签： pandas小技巧

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

pandas几个有用的小技巧

Apply
格式化输出
pandas 格式化输出
map, apply, applymap

Apply

这里就是取一横行的意思，相当于每个横行做一遍循环
df[“max”] = df.apply(lambda x: x.max(), axis=1)
有时这个函数因为index的问题报错，那么就改为
df[“max”] = df[“what”].apply(lambda x: x.max(), axis=1)
或者要求更多的
df[“max”] = df.loc[df.index[0]:df.index[n]:“what”].apply(lambda x: x.max(), axis=1)

多列的情况
df[“diff”] = df.apply(lambda x: x[1] - x[0], axis=1)
注意，这里是两列相减，而不是同一列diff的概念

同一列计算
df[“roll”] = df[“data”].rolling(10).std()
这是算包含本行，10行的标准差问题

df[“roll_diff”] = df[“roll”].shift(periods=1或-1)
这里就是讲这个结果向下移动或者向上移动
一般都是向下移动，比如算，前十个的方差，不包含本行。

格式化输出

“{0:.2f} {1:.1f} {2:.3f}”.format(a,b,c)

pandas 格式化输出

四舍五入取两位小数
df[“data”].round(decimals=2)
利用map函数
df[“data”].map(lambda x: “{0:.2f}”.format(x))

map, apply, applymap

1.apply()
当想让方程作用在一维的向量上时，可以使用apply来完成，如下所示

In [116]: frame = DataFrame(np.random.randn(4, 3), columns=list(‘bde’), index=[‘Utah’, ‘Ohio’, ‘Texas’, ‘Oregon’])

In [117]: frame
Out[117]:
b d e
Utah -0.029638 1.081563 1.280300
Ohio 0.647747 0.831136 -1.549481
Texas 0.513416 -0.884417 0.195343
Oregon -0.485454 -0.477388 -0.309548

In [118]: f = lambda x: x.max() - x.min()

In [119]: frame.apply(f)
Out[119]:
b 1.133201
d 1.965980
e 2.829781
dtype: float64

但是因为大多数的列表统计方程 (比如 sum 和 mean)是DataFrame的函数，所以apply很多时候不是必须的

2.applymap()
如果想让方程作用于DataFrame中的每一个元素，可以使用applymap().用法如下所示

In [120]: format = lambda x: ‘%.2f’ % x

In [121]: frame.applymap(format)
Out[121]:
b d e
Utah -0.03 1.08 1.28
Ohio 0.65 0.83 -1.55
Texas 0.51 -0.88 0.20
Oregon -0.49 -0.48 -0.31

3.map()
map()只要是作用将函数作用于一个Series的每一个元素，用法如下所示

In [122]: frame[‘e’].map(format)
Out[122]:
Utah 1.28
Ohio -1.55
Texas 0.20
Oregon -0.31
Name: e, dtype: object

总的来说就是apply()是一种让函数作用于列或者行操作，applymap()是一种让函数作用于DataFrame每一个元素的操作，而map是一种让函数作用于Series每一个元素的操作

wangyundlut

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas几个有用的小技巧

pandas几个有用的小技巧Apply格式化输出pandas 格式化输出map, apply, applymapApply这里就是取一横行的意思，相当于每个横行做一遍循环df[“max”] = df.apply(lambda x: x.max(), axis=1)有时这个函数因为index的问题报错，那么就改为df[“max”] = df[“what”].apply(lambda x: ...
复制链接

扫一扫