一、什么是pandas?
Pandas是python的核心数据分析支持库,它提供了快速、灵活、明确的数据结构,旨在简单、灵活地处理关系型数据。
二、Pandas的数据结构
1、Series:
Series是一种类似于一维数组的数据结构,它由一组数据(可以是不同的数据类型)以及一组与之相关的数据标签index(即索引)组成,还可以指定Series的名称。
- Series是带有名称和索引的一维数组。
- 数组中的元素可以是任意数据类型的组合。
2、DataFrame:
DataFrame是一种表格型的数据结构。它的每一列可以是不同的值类型(例如布尔型、数值型、字符串等),此外它既有行索引index,又有列索引columns。我们可以将它看成是由Series组成的字典(将每一列看成是一个Series)。
三、Series:
1、使用列表创建:
pd.Series(
data=None, #数据列表
index=None, #索引列表
name=None, #Series名字
dtype=None,
copy=None,
fastpath=Flase)
示例:
tmp=pd.Series(data=[23,'lucky'],index=['age','name'],name='people')
print(tmp)
运行结果:
2、使用字典创建:
pd.Series(
{}
name=None,
dtype=None,
copy=