import numpy as np
import pandas as pd
series
s1 = pd.Series([4,7,-5,3])#创建series,索引为默认值
print(s1)
s1.values#series的值
s1.index#series的索引
s2 = pd.Series([4.0,6.5,-0.5,4.2],index=['d','b','a','c'])
print(s2)
s2['a']
#可根据索引提取数值
s2[['a','b','c']]
#可根据索引提取数值,注意这里两个中括号
'b' in s2
#判断索引是否在series中
#Series可以看成是一个定长的有序字典
dic1 = {'apple':5,'pen':3,'applepen':10}
s3 = pd.Series(dic1)
print(s3)
#Series一旦创建完成,顺序不再更改,而字典无顺序之分
dataframe
#DataFrame
data = {'year':[2014,2015,2016,2017],
'income':[10000,30000,50000,80000],
'pay':[5000,20000,30000,30000]}
df1 = pd.DataFrame(data)
df1
df2 = pd.DataFrame(np.arange(12).reshape((3,4)))
df2
df3 = pd.DataFrame(np.arange(12).reshape((3,4)),
index=['a','c','b'],columns=[2,33,44,5])
#index指定行索引,columns指定列索引
df3
df3.columns
#调用列属性
df3.index
#调用行属性
df3.values #调用值
df3.describe()
#对表进行描述,可以看到属性数,中位数,标准值,最小值,最大值等
df3.T
#可以进行转置,行变成列,列变成行
df3.sort_index(axis=1)#列排序
df3.sort_index(axis=0)#行排序
#对里面某一个单独的列进行排序
df3.sort_values(by=44)