在Python 机器学习的开发环境搭建(numpy,scipy,matplotlib)一文中,介绍了使用python进行数据分析的工具安装,环境配置。下面分享具体使用
一、numpy
1、安装:pip install numpy命令
2、数据分析
import numpy as np
np_height=np.array(height)
np_height
array([1.72,1.68,1.72])
np_weight=np.array(weight)
np_weight
array([55.1,65.0,55.9]) #要求array里都是同一类型数组
bmi=np_weight/np_height**2
bmi[] #可选取某个索引的计算结果
array([output])
bmi[bmi>23] #可选取计算结果大于某值
array([output])
可用于计算身高、体重两个数组的关系,并对计算结果进行筛选查看。处理数组的强大工具包。
3、注意
使用numpy要求array里的每一个元素都是同一数据类型,例如都为int 或者float才可进行处理。
二、matplotlib
1、安装
cd python/scripts安装路径,执行命令pip install matplotlib命令。
2、编写
import matplotlib.pyplot as plt
year=[1991,1992,1993,1994]
pop=[0.1,0.22,0.3,0.45]
#折线图
plt.plot(year,pop)
plt.show()
#散点图
plt.scatter(year,pop)
plt.show()
#直方图
values=[0,0.1,0,0.9,0.8,0.6]
plt.hist(values,bins=3)
#设置图表信息
plt.xlable('年')
plt.ylable('人口数量')
plt.title('人口分布图')
plt.yticks([0,2,4,6,8])