-
目录
import pandas pandas.Series(data=None,index=None,name=None) #通过list创建series对象 import pandas as pd series=pd.Series([1,2,3,4,5]) print(series) #指定index创建series对象 list1=[0,1,5,3,4] i=['a','b','c','d','e'] print('通过list创建的series为:\n',pd.Series(list1,index=i,name='list')) #通过dict创建对象 dict=['a':0,'b':1,'c':5] letter=["a","b","c","e"] print(pd.series(dict,index=letter)) #通过ndarray创建series import pandas as pd import numpy as np print('通过ndarray创建的series为:\n',pd.series(np.arange(3),index=['a','b','c'],name='ndarray')) #访问series的属性 import pandas as pd series1=pd.series([1,2,3,4]) print("series1:\n{}\n".format(series1.values)) print("series1.values:{}\n".format(series1.values))#数据 print("series1.index:{}\n".format(series1.index))#索引 print("series1.shape:{}\n"format(series1.shape))#形状 print("series1.ndim:{}\n":format(series1.ndim))#维度 #访问series数据 import pandas as pd series2=pd.series([1,2,3,4,5,6,7],index=["C","D","E","F","G","A","B"]) #通过索引位置访问 print("series2位于第一位置的数据为:",series2[0]) #通过索引名称访问 print("E is {}\n".format(series2["E"])) #更新series import pandas as pd list1=[1,2,3,4,5] series1=pd.series(list1,index=['a','b','c','d','e'],name='list') print("series1:\n{}\n".format(series1)) #更新元素 series1['a']=3 print("更新后的series1为:\n",series1) #追加series series2=pd.series([4,5],index=['f','g']) print("series1插入series2后为:\n",series1.append(series2)) #删除数据 series1.drop('e',inplace=True) print('删除索引e对应数据后的series1:\n',series1) #dataframe #通过dict创建dataframe import pandas as pd data={'col1':[0,1,2,3,4],'col5':[5,6,7,8,9]} #创建时指定列名 df=pd.dataframe(data,index=['a','b','c','d','e']) print('通过dict创建的dataframe为:\n',df) #创建缺失值 data={ 'name':['张三','李四','王五'] 'sex':['female','male','female'] 'age':['23','20','19'] } df=pd.dataframe(data,columns=['name','age','sex','address']) print('通过dict创建dataframe为: \n',df) #通过list创建dataframe list5=[[1,5],[1,6],[2,7],[3,8],[4,9]] print('通过list创建的dataframe为:\n', pd.dataframe(list5,index=['a','b','c','d','e'],columns=['col1','col5'])) #pandas提取行列数据函数 df.head(N)#返回前N行 df.tail(M)#返回后M行 df[m,n]#切片,选取第m~n-1行 df[df['列名']>value]#选取满足条件的行 df.query('列名>value')#选取满足条件的行 df.query('列名==[v1,v2,v3]')#选取列名值等于v1,v2,v3的行 loc#通过行标签索引数据 iloc#通过行号索引行数据 df['col']#获取col列,返回series iat#提取某一个数据 df2=df.iloc[0:2,0:1]#输出1~2行前1列数据 df3=df.iloc[[0,2],[1,3]]#提取不连续行和列的数据,提取第0,2行,1,3列数据 df4=df.iat[2,1]#提取某一个数据,提取第3行第2列的数据 df['col1']=[10,11,12,13,14]#更新列 df["No"]=pd.series([1,2,3,4,5,6,7])#采用赋值的方法插入列 df.drop('a',axis=0,inplace=True)#删除行 #index对象常用属性 df.index.is_monotonic#index各元素是否大于前一个 df.index.is_unique#index各元素是否唯一 df=df.reindex(['a','b','c','d'],fill_value=0)#缺失值填充用0
今日Python代码_Pandas
最新推荐文章于 2024-06-14 11:20:52 发布