Series与DataFrame 函数应用和映射

最新推荐文章于 2024-04-24 20:31:43 发布

Mikowoo007

最新推荐文章于 2024-04-24 20:31:43 发布

阅读量426

点赞数 1

分类专栏： Python3.5

本文链接：https://blog.csdn.net/Mikowoo007/article/details/96707740

版权

Python3.5 专栏收录该内容

20 篇文章 1 订阅

订阅专栏

函数应用和映射

from pandas import Series,DataFrame
import pandas as pd
import numpy as np

frame = DataFrame(np.random.randn(4,3),
                 columns=list('bde'),index=['Utah','Ohio','Texas','Oregon'])
frame

	b	d	e
Utah	-1.461214	-0.989854	-1.491231
Ohio	-0.186691	1.555308	0.129673
Texas	-0.934857	-0.769416	-1.226763
Oregon	-1.265840	-0.246789	-1.339882

np.abs() 取绝对值

np.abs(frame)

	b	d	e
Utah	1.461214	0.989854	1.491231
Ohio	0.186691	1.555308	0.129673
Texas	0.934857	0.769416	1.226763
Oregon	1.265840	0.246789	1.339882

.apply() 方法将函数应用到由各列或行所形成的一维数组上

f = lambda x: x.max() - x.min()
f

frame.apply(f)      #每列 最大值与最小值 之间的差值

out:

b    1.274523
d    2.545163
e    1.620903
dtype: float64

frame.apply(f,axis=1) # 每行 最大值与最小值 之间的差值

out:

Utah      0.501376
Ohio      1.741999
Texas     0.457347
Oregon    1.093092
dtype: float64

def f(x):
    return Series([x.min(),x.max()],index=['min','max'])
frame.apply(f)

	b	d	e
min	-1.461214	-0.989854	-1.491231
max	-0.186691	1.555308	0.129673

applymap() 得到DataFrame中各个浮点数的格式化字符串

format = lambda x: '%.2f' % x
frame.applymap(format)

	b	d	e
Utah	-1.46	-0.99	-1.49
Ohio	-0.19	1.56	0.13
Texas	-0.93	-0.77	-1.23
Oregon	-1.27	-0.25	-1.34

map() 得到Series各个浮点数的格式化字符串

frame['e'].map(format)

out:

Utah      -1.49
Ohio       0.13
Texas     -1.23
Oregon    -1.34
Name: e, dtype: object

排序和排名

.sort_index() 返回一个已排序的新对象(按列或行索引值进行排序) 默认升序

obj = Series(range(4),index=['b','a','b','c'])
obj

out:

b    0
a    1
b    2
c    3
dtype: int64

obj.sort_index()

out:

a    1
b    0
b    2
c    3
dtype: int64

frame = DataFrame(np.arange(8).reshape((2,4)),
                 index=['three','one'],columns=['d','a','b','c'])
frame

	d	a	b	c
three	0	1	2	3
one	4	5	6	7

frame.sort_index()   #行索引 排序

	d	a	b	c
one	4	5	6	7
three	0	1	2	3

frame.sort_index(axis=1)  #列索引 排序

	a	b	c	d
three	1	2	3	0
one	5	6	7	4

降序

frame.sort_index(axis=1,ascending=False)

	d	c	b	a
three	0	3	2	1
one	4	7	6	5

按单元格值进行排序

obj = Series([4,7,-3,2])
obj

out:

0    4
1    7
2   -3
3    2
dtype: int64

.sort_values()

obj.sort_values()

out:

2   -3
3    2
0    4
1    7
dtype: int64

frame = DataFrame({'b': [4,7,-3,2],'a':[0,1,0,1]})
frame

	a	b
0	0	4
1	1	7
2	0	-3
3	1	2

frame.sort_index(by='b')

	a	b
2	0	-3
3	1	2
0	0	4
1	1	7

frame.sort_index(by=['a','b'])

	a	b
2	0	-3
0	0	4
3	1	2
1	1	7

rank() 排名

obj = Series([7,-5,7,4,2,0,4])
obj

out:

0    7
1   -5
2    7
3    4
4    2
5    0
6    4
dtype: int64

obj.rank()     #最小值排名 第一

out:

0    6.5
1    1.0
2    6.5
3    4.5
4    3.0
5    2.0
6    4.5
dtype: float64

frame = DataFrame({'b':[-4.3,7,-3,2],'a':[0,1,0,1],'c':[-2,5,8,-2.5]})
frame

	a	b	c
0	0	-4.3	-2.0
1	1	7.0	5.0
2	0	-3.0	8.0
3	1	2.0	-2.5

frame.rank(axis=1)

	a	b	c
0	3.0	1.0	2.0
1	1.0	3.0	2.0
2	2.0	1.0	3.0
3	2.0	3.0	1.0

降序

obj.rank(ascending=False)    #最大值排名 靠前

out:

0    1.5
1    7.0
2    1.5
3    3.5
4    5.0
5    6.0
6    3.5
dtype: float64

obj.rank(ascending=False,method='max')

out:

0    2.0
1    7.0
2    2.0
3    4.0
4    5.0
5    6.0
6    4.0
dtype: float64

obj.rank(method='first')

out:

0    6.0
1    1.0
2    7.0
3    4.0
4    3.0
5    2.0
6    5.0
dtype: float64

method选项：

method	说明
average	默认：在相等分组中，为各个值分配平均排名
min	使用整个分组的最小排名
max	使用整个分组的最大排名
frist	按值在原始数据中的出现顺序分配排序

Mikowoo007

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Series与DataFrame 函数应用和映射

函数应用和映射

np.abs() 取绝对值

.apply() 方法 将函数应用到由各列或行所形成的一维数组上

applymap() 得到DataFrame中各个浮点数的格式化字符串

map() 得到Series各个浮点数的格式化字符串

排序和排名

.sort_index() 返回一个已排序的新对象(按列或行索引值进行排序) 默认升序

降序

按单元格值 进行排序

.sort_values()

rank() 排名

降序

.apply() 方法将函数应用到由各列或行所形成的一维数组上

按单元格值进行排序