numpy介绍
numerical (数值化的)+ python
numpy是一个开源的python科学计算库,用于快速处理任意维度的数组
n d array
n-任意
d-dimension 维度
array-数组
先将数据存储与ndarray一种数据类型
numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器
jupyter notebook
使用python的列表也可以存储一组数据,通过列表的嵌套也可以实现多维数组,那么为什么还需要numpy其中的ndarray
生成数组要引用random
机器学习最大的特点就是大量的数据运算
为什么ndarray为什么这么快
1)存储风格
2)并行化运算
3)底层语言
ndarray - 相同类型 - 通用性不强
list - 不同类型 - 通用性很强
ndarray支持并行化运算
用C语言写的底层
ndarray的属性、形状、类型
shape ndim size
dtype
元组,8行5列
几个纬度
多少个
在创建ndarray的时候
整数是int64
ndarray
np.array()来进行操作
生成数组的方法
生成0和1
从现有数组中生成
生成固定范围的数组
生成随机数
从现有数组中生成
np.array 与 np.copy 深拷贝
np.asrray 全拷贝
np.linpace(0,10 ,100)
左闭右闭 生成等距离100个元素
其中100是多少个数
np.arange(a,b,c)
左开右闭
这里面的C是步长,而不是总数量
生成随机数组
分布状况
均匀分布:是概率统计中的重要分布之一,顾名思义,均匀,表示可能性相等的含义。均匀分布在自然情况下极为罕见,而人工栽培的有一定株行距的植物群落就是均匀分布
均匀分布
落在每组的可能性相等
正态分布
sigma决定了分布的幅度