数据
#创建一个示例数据
import pandas as pd
country1 = pd.Series({'Name': '中国',
'Language': 'Chinese',
'Area': '9.597M km2',
'Happiness Rank': 79})
country2 = pd.Series({'Name': '美国',
'Language': 'English (US)',
'Area': '9.834M km2',
'Happiness Rank': 14})
country3 = pd.Series({'Name': '澳大利亚',
'Language': 'English (AU)',
'Area': '7.692M km2',
'Happiness Rank': 9})
df = pd.DataFrame([country1, country2, country3], index=['CH', 'US', 'AU'])
print(df)
数据提取
#数据切片
df['Name'][:2] #列Age的前2行
df[['Name','Language']][:2] #列Name和列Language的前5行
使用iloc和loc筛选数据
df.iloc[0] #数据的第一行
df.iloc[0:5] #数据的前5行
df.iloc[0:5,1:3] #前5行的前2列
df.loc['CH'] #取出名为Heikkinen的行
print('先取出列,再取行:')
print(df['Area']['CH']) #9.597M km2
print(df['Area'].loc['CH']) #9.597M km2
print(df['Area'].iloc[0]) #9.597M km2
print('先取出行,再取列:')
print(df.loc['CH']['Area']) #9.597M km2
print(df.iloc[0]['Area']) #9.597M km2
数据值筛选
df[df['Happiness Rank'] > 5][:3] #将列Happiness Rank中值大于40的值筛选出来并且取前5个值