pandas 安装
1. 在cmd命令行下进行安装
在命令行里面输入 pip install pandas 入下图所示
等待安装完成会提示Requirement already satisfied... 因为pandas 需要使用模块numpy,所以我们也把这个模块一起安装上 使用相同的方法: pip install numpy ps:其他平台安装方法
推荐安装anaconda
因为这个里面已经包含了所有的常用数据分析处理库,比如pandas,numpy,matplotlib...
点击去官方网站连接
2. 导入pandas模块
import pandas as pd 根据大众约定重命名为pd,然后就可以使用了。导入时如果没有报错,那么恭喜你,pandas 已经可以正常使用了
import pandas as pd
import numpy as np
3. 创建一个dataframe对象
我们会使用anaconda的Jupyter Nootbook来演示我们的操作.
使用list来创建一个Series,使用默认索引。
import pandas as pd
import numpy as np
s = pd.Series([1,3,4,np.nan,6,8])
s
使用numpy数组来创建一个DataFrme对象,使用时间作为索引标签:
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD')
df
使用字典,numpy数组,list等创建DataFrame
df2 = pd.DataFrame({ 'A' : 1,
'B' : pd.Timestamp('20130102'),
'C' : pd.Series(1,index=list(range(4)),dtype='float32'),
'D' : np.array([3] * 4,dtype='int32'),
'E' : pd.Categorical(["test","train","test","train"]),
'F' : 'foo' })
df2
查看df2数据类型:
df2.dtypes
本节的重点
很多人在安装的时候遇到问题,其实这是很好解决的。你遇到过的问题90%都发生在别人身上过。剩下的10%就得靠自己去尝试,加上一点点运气~来吧,开启你的pandas数据之旅~~