十分钟了解pandas（总结）

最新推荐文章于 2020-11-20 13:03:17 发布

点火三周

最新推荐文章于 2020-11-20 13:03:17 发布

阅读量1.2k

点赞数 2

分类专栏：数据挖掘与机器学习

本文链接：https://blog.csdn.net/u013613428/article/details/78257114

版权

本文概括了Pandas的基本操作，包括创建Series、DataFrame，查看数据的首尾、统计信息，选取数据，设置值，处理缺失值，以及merge、reshape、TimeSeries和绘图等功能。通过标签和位置选取数据，利用布尔索引和grouping进行数据操作，是理解Pandas的关键。

摘要由CSDN通过智能技术生成

这里是官网上的原文。每次都还链接到最新版本。这篇文章，对于不是英语母语的，10分钟，我觉得绝逼是看不完的。网上已经有很多翻译了。我只是把文章的结构组织以下，死记硬背一下它提到的知识点。

s = pd.Series([1,3,5,np.nan,6,8])

dates = pd.date_range('20130101', periods=6)

df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))

df.head()
df.tail(5)

df.index
df.columns
df.values

df.describe()

df.T

df.sort_index(axis=1, ascending=False)

df.sort_values(by='B')

df['A']
df[['A','B']]

df[0:3]
df['20130102':'20130104']

df.loc[dates[0]]
df.loc[:,['A','B']]
df.loc['20130102':'20130104',['A','B']]
df.loc[dates[0],'A']
df.at[dates[0],'A']

df.iloc[3]
df.iloc[3:5,0:2]
df.iloc[[1,2,4],[0,2]]
df.iloc[1:3,:]
df.iloc[:,1:3]
df.iloc[1,1]
df.iat[1,1]

df[df.A > 0]

关注

专栏目录