import numpy as np import pandas as pd data = {"省份":['北京', "上海", "天津", "重庆", "江苏", "浙江", "广东"], "年份":[2017, 2015, 2013, 2016, 2009, 2011, 2005], "总人数":[2115, 2415, 1007, 5000, 6992, 36002, 82396], "高考人数":[6.06, 5.1, 6.21, 24.89, 36.04, 88.31, 62.38] } frame1 = pd.DataFrame(data, columns=["年份", "省份","总人口","高考人数"],index=["one", "two", "three", "four", "five", "six", "seven"]) print(frame1)
输出:
年份 省份 总人数 高考人数
one 2017 北京 2115 6.06
two 2015 上海 2415 5.10
three 2013 天津 1007 6.21
four 2016 重庆 5000 24.89
five 2009 江苏 6992 36.04
six 2011 浙江 36002 88.31
seven 2005 广东 82396 62.38
data1 = frame1.head(3)#打印出前三行
data2 = frame1.tail(4)#打印出后四行
输出前三行
data1: 年份 省份 总人数 高考人数
one 2017 北京 2115 6.06
two 2015 上海 2415 5.10
three 2013 天津 1007 6.21
输出后四行
data2: 年份 省份 总人数 高考人数
four 2016 重庆 5000 24.89
five 2009 江苏 6992 36.04
six 2011 浙江 36002 88.31
seven 2005 广东 82396 62.38
data3 = frame1[1:5]#用切片输出第二行到第五行数据 print("data3:",data3)
输出:
data3: 年份 省份 总人数 高考人数
two 2015 上海 2415 5.10
three 2013 天津 1007 6.21
four 2016 重庆 5000 24.89
five 2009 江苏 6992 36.04
data4 = frame1[frame1.总人数 > 2500]#取出符合条件的行(总人数大于2500) print("data4:",data4)
输出:
data4: 年份 省份 总人数 高考人数
four 2016 重庆 5000 24.89
five 2009 江苏 6992 36.04
six 2011 浙江 36002 88.31
seven 2005 广东 82396 62.38
data5 = frame1.iloc[[0,2,4]]#取出第一行和第三行及第五行 print("data4:",data5)
data4: 年份 省份 总人数 高考人数
one 2017 北京 2115 6.06
three 2013 天津 1007 6.21
five 2009 江苏 6992 36.04
data6 = frame1.iloc[0:2,]#取出第一行和第二行 print("data6:",data6)
data6: 年份 省份 总人数 高考人数
one 2017 北京 2115 6.06
two 2015 上海 2415 5.10
data7 = frame1.loc["two":"five"]#取出第二行到第五行 print("data7:",data7)
data7: 年份 省份 总人数 高考人数
two 2015 上海 2415 5.10
three 2013 天津 1007 6.21
four 2016 重庆 5000 24.89
five 2009 江苏 6992 36.04