python Numpy 的基础用法以及 matplotlib 基础图形绘制
1. 环境搭建
1.1 Anaconda
anaconda 集成了数据分析,科学计算相关的所有常用安装包,比如Numoy、Scipy、Matplotlib、Ipython 等等。
1.2 pycharm
非常好用的python集成开发环境。
2. Numpy是什么
-
Numpy 是 python 的开源的数值计算扩展
-
可用来存储和处理大型矩阵,比python自身数据结构高效
-
Numpy 将python 变成一种免费的强大的Matlab系统
2.1 Numpy的核心数据对象ndarray
相当于一个矩阵,存储了我们所需要的一些数据
2.1.1 创建ndarray数据对象的三种方式
-
从python的基础数据对象转化
import numpy as np list1 = [1,2,3] x1 = np.array(list1) print(x1) -----> array([1,2,3]) # numpyarray 对象
-
通过Numpy内生的函数生成
x1 = np.arange(3) print(x1) -----> array([0,1,2])
-
从硬盘文件读取数据
-
x1 = np.loadtxt('文件名',delimiter='已什么符号做分割',skiprows=跳过第几行,usecols=(用到第几列,列数 ,列数.. ),unpack=False) # 返回数组 # 其他参数 import matplotlib.dates as mdates converters = { 0:mdates.strpdate2num('%m/%d/%Y')} # 转换日期格式的数据 23/2/2021 0是列数
2.1.2 基本操作
c = np.arange(11) c+c # 矩阵加法 c-c # 矩阵减法 等等 # 索引和切片 c[0] ----> 0 c[3] ----> 3 c[-1] ----> 10 c[0:5] ----> array([0,1,2,3,4]) # 等等python list 支持的切片语法 # numpy 中经常用到的统计函数 min max medain mean (均值) variance (方差) sort # numpy 中调用一个函数 np.func(x) x.func() # 列: c = np.random.randint(1,100,10) # 随机生成10个1-100的整数 np.max(c) np.mean(c) 或 c.max() c.min() 两者区别在于 使用第一种 会生成一个新的序列 使用第二种 c 变化 并不产生一个新的序列
3. 0 matplotlib 的使用:
3.1 : 散点图
顾名思义就是由一些散乱的点组成的图表,这些点在哪个位置,是由其X值和Y值确定的。所以 也叫 做XY散点图。
散点图最大作用就是验求两个变量的相关性
相关性: 正相关 、负相关、 不相关
正相关:散点图有明显向右上的趋势
负相关:散点图有明显的右下趋势
不相关 : 散点图没有明显的趋势
实列 :股票价格涨幅
# 散点图实例 列如 身高和体重的散点图
import matplotlib.pyplot as plt
height = [161,170,183,190,156]
weight