今日Python代码_Pandas

最新推荐文章于 2024-07-29 14:37:54 发布

苑苑圆圆

最新推荐文章于 2024-07-29 14:37:54 发布

阅读量28

点赞数

分类专栏： python学习日常文章标签： python pandas 学习

本文链接：https://blog.csdn.net/luyuanyuan0313/article/details/132356689

版权

python学习日常专栏收录该内容

7 篇文章 0 订阅

订阅专栏

import pandas
pandas.Series(data=None,index=None,name=None)
#通过list创建series对象
import pandas as pd
series=pd.Series([1,2,3,4,5])
print(series)
#指定index创建series对象
list1=[0,1,5,3,4]
i=['a','b','c','d','e']
print('通过list创建的series为：\n',pd.Series(list1,index=i,name='list'))
#通过dict创建对象
dict=['a':0,'b':1,'c':5]
letter=["a","b","c","e"]
print(pd.series(dict,index=letter))
#通过ndarray创建series
import pandas as pd
import numpy as np
print('通过ndarray创建的series为：\n'，pd.series(np.arange(3),index=['a','b','c'],name='ndarray'))
#访问series的属性
import pandas as pd
series1=pd.series([1,2,3,4])
print("series1:\n{}\n".format(series1.values))
print("series1.values:{}\n".format(series1.values))#数据
print("series1.index:{}\n".format(series1.index))#索引
print("series1.shape:{}\n"format(series1.shape))#形状
print("series1.ndim:{}\n":format(series1.ndim))#维度
#访问series数据
import pandas as pd
series2=pd.series([1,2,3,4,5,6,7],index=["C","D","E","F","G","A","B"])
#通过索引位置访问
print("series2位于第一位置的数据为："，series2[0])
#通过索引名称访问
print("E is {}\n".format(series2["E"]))
#更新series
import pandas as pd
list1=[1,2,3,4,5]
series1=pd.series(list1,index=['a','b','c','d','e'],name='list')
print("series1:\n{}\n".format(series1))
#更新元素
series1['a']=3
print("更新后的series1为：\n",series1)
#追加series
series2=pd.series([4,5],index=['f','g'])
print("series1插入series2后为：\n",series1.append(series2))
#删除数据
series1.drop('e',inplace=True)
print('删除索引e对应数据后的series1：\n',series1)
#dataframe
#通过dict创建dataframe
import pandas as pd
data={'col1':[0,1,2,3,4],'col5':[5,6,7,8,9]}
#创建时指定列名
df=pd.dataframe(data,index=['a','b','c','d','e'])
print('通过dict创建的dataframe为：\n',df)
#创建缺失值
data={
    'name':['张三','李四'，'王五']
    'sex':['female','male','female']
    'age':['23','20','19']
     }
df=pd.dataframe(data,columns=['name','age','sex','address'])
print('通过dict创建dataframe为: \n',df)
#通过list创建dataframe
list5=[[1,5],[1,6],[2,7],[3,8],[4,9]]
print('通过list创建的dataframe为：\n',
      pd.dataframe(list5,index=['a','b','c','d','e'],columns=['col1','col5']))
#pandas提取行列数据函数
df.head(N)#返回前N行
df.tail(M)#返回后M行
df[m,n]#切片，选取第m~n-1行
df[df['列名']>value]#选取满足条件的行
df.query('列名>value')#选取满足条件的行
df.query('列名==[v1,v2,v3]')#选取列名值等于v1,v2,v3的行
loc#通过行标签索引数据
iloc#通过行号索引行数据
df['col']#获取col列，返回series
iat#提取某一个数据

df2=df.iloc[0:2,0:1]#输出1~2行前1列数据
df3=df.iloc[[0,2],[1,3]]#提取不连续行和列的数据，提取第0,2行，1,3列数据
df4=df.iat[2,1]#提取某一个数据，提取第3行第2列的数据
df['col1']=[10,11,12,13,14]#更新列
df["No"]=pd.series([1,2,3,4,5,6,7])#采用赋值的方法插入列
df.drop('a',axis=0,inplace=True)#删除行

#index对象常用属性
df.index.is_monotonic#index各元素是否大于前一个
df.index.is_unique#index各元素是否唯一
df=df.reindex(['a','b','c','d'],fill_value=0)#缺失值填充用0