写在前面:
大家再读别人文档的时候,一定有过以下方面的苦恼:
1、为啥我复制别人的代码总是执行报错;(内心mmp,劳资就是想学个技术,咋就这么难了???)
emmn,一定是你的计算机环境与别人不一样;(强烈建议大家回答问题,写文档时加上自己的开发环境和使用软件的版本。)
比如我现在就想学习数据分析,那么第三方库Numpy,Pandas就是必须的;可是,一般的书籍上来就推荐你用python2.x,3.x,然后你觉得不好用,就下载pythonIDE,pythonChram;可是你下载了这么多,发现还是没有第三方库Numpy,Pandas(这时候你的激情可能被消耗殆尽);
正确做法是:直接下载Anaconda--python集成环境,除了python基本功能外,还自动下载了数据分析必备的第三方库;
下载地址:https://www.anaconda.com/download/
安装视屏:https://edu.hellobi.com/course/234/lessons
- Jupyter notebook 安装管理:https://www.zhihu.com/collection/236101838
- Anaconda 安装管理:https://www.zhihu.com/collection/236101838
为什么要用 NumPy 数组结构而不是 Python 本身的列表 list?这是因为列表 list 的元素在系统内存中是分散存储的,而 NumPy 数组存储在一个均匀连续的内存块中,这样数组计算遍历所有的元素,不像列表 list 还需要对内存地址进行查找从而节省了计算资源。
另外 NumPy 中的矩阵计算可以采用多线程的方式,充分利用多核 CPU 计算资源,大大提升了计算效率。
在 NumPy 里有两个重要的对象ndarray(N-dimensional array object)解决了多维数组问题,而 ufunc(universal function object)则是解决对数组进行处理的函数。
ndarray 对象
在 NumPy 数组中,维数称为秩(rank),一维数组的秩为 1,二维数组的秩为 2;在 NumPy 中,每一个线性的数组称为一个轴(axes),其实秩就是描述轴的数量。
创建数组
import numpy as np
a = np.array([1, 2, 3])
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
b[1,1]=10
print a.shape
print b.shape
print a.dtype
print b
输出
(3L,)
(3L, 3L)
int32
[[ 1 2 3]
[ 4 10 6]
[ 7 8 9]]
创建数组前,你需要引用 NumPy 库,可以直接通过 array 函数创建数组;a是一维数组,b是二维数组;(二维数组就是在【】内嵌套【】)
可以通过函数 shape 属性获得数组的大小,
通过 dtype 获得元素的属性
注意下标是从 0 开始计的
快速构建数组
#通过数组创建一个二维的ndarray
data2 = [[1,2,3,4],[5,6,7,8]]
arr2 = np.array(data2)
print(arr2)]
输出:
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
##创建全0数组
np.zeros(10)
输出
array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
#创建3个1数组
np.ones(3)
输出:
array([1., 1., 1.])
#创建等差数组
np.arange(1,15,2)#不包括15
输出
array([ 1, 3, 5, 7, 9, 11, 13])
#创建正态分布随机数数组
samples = np.random.normal(2,3,size=(4,4))#均值为2,sd=3
samples
#创建随机整数数组,上限10,下限0
draws = np.random.randint(0,10,size=(3,4))
输出
array([[2, 2, 4, 5],
[7, 5, 8, 5],
[9, 0, 6, 1]])
示例构建数组
如果你想统计一个班级里面学生的姓名、年龄,以及语文、英语、数学成绩该怎么办?