Pandas 是 Python 语言的一个扩展程序库,用于数据分析。
Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysis"(Python 数据分析)。
Pandas 一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。
目录
一、Pandas Series——列,一维数据
Series是一种类似于一维数组的对象,它由一组数据data(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)index 组成。
Series 类似Excel表格中的一个列(column),类似于一维数组,可以保存任何数据类型。
1.加载和使用 pandas
import pandas as pd #一般别名为pd
pd.函数名 #调用pandas函数
2.pd.Series
生成Series
pandas.Series( data, index, dtype, name, copy)
#参数说明:
#函数名Series中,S开头大写
#data:一组数据(ndarray 类型)。
#index:数据索引标签,如果不指定,默认从 0 开始。可自行设置,索引数据可重复,不一定为自然数列
#index数量必须与data数量一致
#dtype:数据(data)的数据类型,默认会自己判断。
#name:设置名称。
#copy:拷贝数据,默认为 False。
方式一:通过函数定义生成列
#方式一:通过函数定义生成列
import pandas as pd
a = ["ni", "hao", "ma"]
my_s = pd.Series(a, index = ["x", "y", "z"])
print(my_s)
#输出结果:
x ni
y hao
z ma
dtype: object
方式二:通过字典生成列
#方式二:通过字典生成列
import pandas as pd
a = {"x":"ni", "y":"hao", "z":"ma"}
my_s = pd.Series(a)
print(my_s)
#输出结果:
x ni
y ha