Series与DataFrame索引、选取和过滤

最新推荐文章于 2023-02-25 11:38:41 发布

Mikowoo007

最新推荐文章于 2023-02-25 11:38:41 发布

阅读量1.7k

点赞数 2

分类专栏： Python3.5

本文链接：https://blog.csdn.net/Mikowoo007/article/details/96447192

版权

Python3.5 专栏收录该内容

20 篇文章 1 订阅

订阅专栏

Series

from pandas import Series
import numpy as np
obj = Series(np.arange(4),index=['a','b','c','d'])
obj

a    0
b    1
c    2
d    3
dtype: int64

obj['b']

obj[1]

obj[2:4]

c    2
d    3
dtype: int64

obj[['b','a','d']]

b    1
a    0
d    3
dtype: int64

obj[[1,3]]

b    1
d    3
dtype: int64

obj[obj < 2]

a    0
b    1
dtype: int64

DataFrame

索引列

from pandas import DataFrame
data = DataFrame(np.arange(16).reshape((4,4,)),
                index=['Ohio','Colorado','Utah','New York'],columns=['one','two','three','four'])
data

	one	two	three	four
Ohio	0	1	2	3
Colorado	4	5	6	7
Utah	8	9	10	11
New York	12	13	14	15

data['two']

Ohio         1
Colorado     5
Utah         9
New York    13
Name: two, dtype: int64

data[['three','one']]

	three	one
Ohio	2	0
Colorado	6	4
Utah	10	8
New York	14	12

索引行

data[:2]  # 返回行

	one	two	three	four
Ohio	0	1	2	3
Colorado	4	5	6	7

data['three'] > 5

Ohio        False
Colorado     True
Utah         True
New York     True
Name: three, dtype: bool

data[data['three'] > 5]

	one	two	three	four
Colorado	4	5	6	7
Utah	8	9	10	11
New York	12	13	14	15

类型	说明
obj[val]	选取DataFrame的单个列或一组列. 在一些特殊情况下会比较便利：布尔型数组(过滤行)、切片(行切片)、布尔型DataFrame(根据条件设置值)
obj.ix[val]	选取DataFrame的单个行或一组行
obj.ix[:,val]	选取单个列或列子集
obj.ix[val1,val2]	同时选取行和列
reindex方法	将一个或多个轴匹配到新索引
xs方法	根据标签选取单行或单列，并返回一个Series
icol、irow方法	根据整数位置选取单行或单列，并返回一个Series
get_value,set_value方法	根据行标签和列标签选取单个值

data.ix['Colorado',['two','three']]

two      5
three    6
Name: Colorado, dtype: int64

data.ix[['Colorado','Utah'],[3,0,1]]

	four	one	two
Colorado	7	4	5
Utah	11	8	9

data.ix[2]  #返回列

one       8
two       9
three    10
four     11
Name: Utah, dtype: int64

data.ix[:'Utah','two']

Ohio        1
Colorado    5
Utah        9
Name: two, dtype: int64

data.ix[data.three > 5, :3]

	one	two	three
Colorado	4	5	6
Utah	8	9	10
New York	12	13	14

赋值

data < 5

	one	two	three	four
Ohio	True	True	True	True
Colorado	True	False	False	False
Utah	False	False	False	False
New York	False	False	False	False

data[data < 5] = 0
data

	one	two	three	four
Ohio	0	0	0	0
Colorado	0	5	6	7
Utah	8	9	10	11
New York	12	13	14	15

带有重复值的轴索引

from pandas import Series,DataFrame
import numpy as np

obj = Series(range(5),index=['a','a','b','b','c'])
obj

a    0
a    1
b    2
b    3
c    4
dtype: int64

index.is_unique 属性判断索引是否唯一

obj.index.is_unique

False

obj['a']

a    0
a    1
dtype: int64

df = DataFrame(np.random.randn(4,3),index=['a','a','b','b'])
df

	0	1	2
a	-0.988105	0.662467	1.778395
a	-1.021417	0.470186	0.754296
b	0.035519	0.598257	-1.034743
b	0.119780	2.094730	0.799680

df.ix['b']

	0	1	2
b	0.035519	0.598257	-1.034743
b	0.119780	2.094730	0.799680

Mikowoo007

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Series与DataFrame索引、选取和过滤

Seriesfrom pandas import Seriesimport numpy as npobj = Series(np.arange(4),index=['a','b','c','d'])obja 0b 1c 2d 3dtype: int64obj['b']1obj[1]1obj[2:4]c 2d 3dt...
复制链接

扫一扫