import pandas as pd
#Series可以看成是一维数组的对象,里面包含一组数据和与数据相对应的数据索引。
se = pd.Series([1,2,3,'2q13e2'], index =[1,2,3,'qwe'])print(se)print(se.values)print(se.index)print(se[3])print('\n')print(se[[2,'qwe']])
se*2print(se)
import pandas as pd
#DataFrame是一个二维的表格型数据结构,它既有行索引也有列索引,可以看做是由Series组成的字典,我们可以使用Series构成的字典来构建DataFrame:
d ={'one':pd.Series([3,4,6],index =['a','b','c']),'two':pd.Series([6,7,8],index=['a','b','d'])}
df = pd.DataFrame(d)print(df)print(type(df))print(df.index)#行索引print(df.columns)#列索引
d1 = pd.DataFrame(d, columns=['one'])print(d1)
d2 = pd.DataFrame(d, index=['a'])print(d2)
d3 = pd.DataFrame(d, index=['a'],columns=['one','three'])print(d3)print("\n\n")print(df[['one','two']])print(df['one']['a'])print(df['one'][['a','b']])#也可以直接添加新的列print(type(df['one']))
df['three']= df['one']+1
df['four']= pd.Series([1,1,1],index =['a','b','c'])print(df)#我们也可以进行数据的选取和过滤
df['flag']= df['one']<df['two']#NaN存在 都为falseprint(df)#我们可以通过pop方法返回一个特定列,并删除原有的列上的数据:
flag = df.pop('flag')print(type(flag))print(flag)print(df)#直接删除列数据del df['four']print(df)#我们也可以使用drop方法删除行数据:
a = df.drop('a')#返回剩余的dataframe 原df内容还存在print(type(a))print(a)print(df)
import pandas as pd#Series可以看成是一维数组的对象,里面包含一组数据和与数据相对应的数据索引。se = pd.Series([1,2,3,'2q13e2'], index = [1,2,3,'qwe'])print (se)print(se.values)print(se.index)print(se[3])print('\n')print(se[[2,'...