- Pandas教程
功能:用于数据分析
应用:一维数据(Series)【数组类型】、二维数据(DataFrame)【表格类型】 - Pandas安装
在命令行窗口输入:
pip install pandas
使用:
导入包使用
import pandas
查看版本
>>> pandas.__version__
'1.3.4'
导入pandas一般使用别名pd来代替
import pandas as pd
一个实例:
>>> import pandas as pd
>>> mydataset={'sites' : ["Google", "Runoob", "Wiki"], 'number': [1,2,3]}
>>> myvar = pd.DataFrame(mydataset)
>>> print(myvar)
输出结果:
>>> print(myvar)
sites number
0 Google 1
1 Runoob 2
2 Wiki 3
- Pandas数据结构----- Series
特点:类似表格中的一个列,由索引和列组成
实例:如果没有指定索引,那么就是从0开始,我们可以根据索引值读取数据
指定了索引值
根据索引值读取数据:
使用key/value对象,来创建Series:
>>> import pandas as pd
>>> sites={1:"Google",2:"Runoob",3:"Wiki"}
>>> myvar=pd.Series(sites)
>>> print(myvar)
1 Google
2 Runoob
3 Wiki
dtype: object
字典的key变成了这里的索引值
如果只需要字典中的一部分数据,只需要指定需要数据的索引即可:
设置Series名称参数:
- Pandas数据结构 DataFrame
这是一种表格型的数据结构,既有行索引,也有列索引;是一个二维的数组结构,类似二维数组
实例一:使用列表创建
>>> import pandas as pd
>>> data=[['Google',10],['Runoob',12],['Wiki',13]]
>>> df = pd.DataFrame(data,columns=['Site','Age'],dtype=float)
>>> print(df)
Site Age
0 Google 10.0
1 Runoob 12.0
2 Wiki 13.0
>>>
实例二:使用ndarrays创建
>>> data1={'Sites':['Google','Runoob','Wiki'],'Age':[10,12,13]}
>>> df = pd.DataFrame(data)
>>> print(df)
0 1
0 Google 10
1 Runoob 12
2 Wiki 13
>>>
实例3:使用字典创建,没有数据对应部分为NaN
>>> data3=[{'a':1,'b':2},{'a':5,'b':10,'c':20}]
>>>> df1=pd.DataFrame(data3)
>>>> print(df1)
a b c
0 1 2 NaN
1 5 10 20.0
- Pandas CSV
- Pandas JSON
- Pandas数据清洗