什么是Pandas?
pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包
Pandas的数据结构
Series:类似于定长的有序字典,有Index和value。(Index可以重复)
DataFrame:类似电子表格的数据结构,包含一个经过排序的列表集,每列都可以有不同的类型值(数字,字符串,布尔等等)。Datarame有行和列的索引;它可以被看作是一个Series的字典(每个Series共享一个索引)。因为DataFrame在内部把数据存储为一个二维数组的格式,因此你可以采用分层索引以表格格式来表示高维的数据。分层索引是pandas中许多更先进的数据处理功能的关键因素。
Pandas的常用函数
Series>>>s,DataFrame>>>df,Pandas>>>pd