numpy、scipy、pandas都是python语言中的库,主要用于数据分析。
简要地说numpy主要用于处理矩阵,包括array、reshape、sort等功能,pandas是基于numpy的分析工具,包括Series、DataFrame功能,scipy是基于numpy的科学计算包。matplotlib用于数据的画图。
首先我们导入所有包
首先使用array创建二维数组
选取输出数组[0][0]值,选取方法跟c语言一样
选取输出[0]行值
使用pd.Series方法创建一维数组,需要注意的是排列方式为竖排列
更改数组索引
根据索引寻找数据
使用DataFrame创建表格型数据结构
选取表格中姓名进行输出
python选取规则为左闭右开(左选右不选)
给数据加上新的标签并赋值
选取表格中name 字段和sex字段进行输出
找寻标签sex=='女'的进行输出
与上面形成对比,直接使用df.sex输出为bool型进行判断
对于数据进行一定的选取规则限制
下面是一个最简单的数据可视化例子