数据分析工具Pandas基础--DataFrame的索引操作

知识要点

依据索引获取数据:

列索引:df_obj[‘label’]

不连续列索引:df_obj[ [‘label1’, ‘label2’] ]

行索引,loc[ ],iloc[ ]

Inplace参数:

Pandas中的很多操作都有参数inplace,如 drop(),replace() …

默认 inplace=False,表示将操作后的结果进行返回,对原始数据不会产生影响

inplace=True,没有返回值,在原始数据上进行操作,对原始数据会产生影响

 

 

 

第五节 DataFrame的索引操作

In [1]:

 

 
import pandas as pd
import numpy as np

In [3]:

 

# 构建DataFrame
country1 = pd.Series({'Name':'中国',
                      'Language':'Chinese',
                     'Area':'9.597M km2',
                     'Happiness Rank': 79})
country2 = pd.Series({'Name':'美国',
                      'Language':'USA',
                     'Area':'9.83M km2',
                     'Happiness Rank': 14})
country3 = pd.Series({'Name':'澳大利亚',
                      'Language':'Austria',
                     'Area':'7.692M km2',
                     'Happiness Rank': 9})
df = pd.DataFrame([country1,country2,country3],index=['CH','US','AU'])

In [4]:

 

 
df

Out[4]:

 NameLanguageAreaHappiness Rank
CH中国Chinese9.597M km279
US美国USA9.83M km214
AU澳大利亚Austria7.692M km29

列索引

In [5]:

 

 
df['Area']

Out[5]:

CH    9.597M km2
US     9.83M km2
AU    7.692M km2
Name: Area, dtype: object

不连续索引

In [7]:

 

 
df[['Area','Name']]

Out[7]:

 AreaName
CH9.597M km2中国
US9.83M km2美国
AU7.692M km2澳大利亚

行索引

In [10]:

 

 
type(df.loc['CH'])

Out[10]:

pandas.core.series.Series

In [9]:

 

df.iloc[1]

Out[9]:

Name                     美国
Language                USA
Area              9.83M km2
Happiness Rank           14
Name: US, dtype: object

混合索引

In [11]:

 

 
# 先行后列
print(df.loc['CH']['Area'])
print(df.iloc[0]['Area'])
9.597M km2
9.597M km2

In [12]:

 

 
# 先列后行
print(df['Area']['CH'])
print(df['Area'].loc['CH'])
print(df['Area'].iloc[0])
9.597M km2
9.597M km2
9.597M km2

inplace参数

In [13]:

 

 
df

Out[13]:

 NameLanguageAreaHappiness Rank
CH中国Chinese9.597M km279
US美国USA9.83M km214
AU澳大利亚Austria7.692M km29

In [14]:

 

 
# 删除Area列
df.drop('Area',axis=1)

Out[14]:

 NameLanguageHappiness Rank
CH中国Chinese79
US美国USA14
AU澳大利亚Austria9

In [15]:

 

 
# df没有影响
df

Out[15]:

 NameLanguageAreaHappiness Rank
CH中国Chinese9.597M km279
US美国USA9.83M km214
AU澳大利亚Austria7.692M km29

正确的写法

In [16]:

 

 
# 写法1:默认inplace=False,返回操作后的结果
df2 = df.drop('Area',axis=1)
df2

Out[16]:

 NameLanguageHappiness Rank
CH中国Chinese79
US美国USA14
AU澳大利亚Austria9

In [17]:

 

# 写法2:inplace=True,在员数据上产生影响,返回None
df.drop('Area',axis=1,inplace=True)
df

Out[17]:

 NameLanguageHappiness Rank
CH中国Chinese79
US美国USA14
AU澳大利亚Austria9

In [ ]:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值