Pandas库的基本使用 pip安装 Series DataFrame
安装pip
pip是Python的包管理工具,熟悉Linux的朋友应该对包管理工具很熟悉(yum),一些库被集成在了pip中,因此我们需要安装pip(win10)
在自定义位置解压pip包
使用cmd进入自定义路径,执行python setup.py install
添加pip环境变量,在PATH后添加Python安装路径/Scripts
新建cmd或者重启Pycharm,输入pip命令,出现使用说明则为配置成功
Pandas简介
Pandas是基于Numpy构建的拥有更高级数据结构以及分析能力的工具包
两个核心的数据结构:
Series(一维序列)
DataFrame(类似数据库表,二维表结构,与json的锲合度很高)
Pandas可以对数据进行导入、清洗、处理、统计和输出,对于不是很复杂的数据,使用几句pandas代码就可以对数据进行规整
Series
Series 是定长的字典序列,相当于两个ndarray,一列是数据,一列可以是索引
# Series 创建方式一 直接调用Series创建,可以手动指定索引(相当于字典的key)
x1 = Series([1, 2, 3, 4])
x2 = Series(data=[1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
print(x1)
print(x2)
# Series 创建方式二 以