numpy、pandas、matplotlib、sklearn是python机器学习领域,最核心的几个模块,玩转了这几个模块也就玩转了机器学习,其中,numpy又是这几个模块中最基础的模块。
内置数据结构——ndarray一、创建ndarray:
1、基于list或tuple
2、基于np.arange:
3、基于np.arange和reshape构建多维数组:
4、基于random构建随机数组:
(1)numpy.random.rand(d0,d1,…,dn)
rand 函数根据给定维度生成 [0,1) 之间的数据,包含 0,不包含 1
dn 表格每个维度
返回值为指定维度的 array
(2)numpy.random.randn(d0,d1,…,dn)
• randn 函数返回一个或一组样本,具有标准正态分布。
• dn 表格每个维度
• 返回值为指定维度的 array
(3)numpy.random.randint(low, high=None, size=None, dtype=“l”)
• 返回随机整数,范围区间为 [low,high),包含 low,不包含 high
• 参数:low 为最小值, high 为最大值, size 为数组维度大小, dtype 为数据类型,默认的数据类型是 np.int
• high 没有填写时,默认生成随机数的范围是 [0, low)
(4)生成 [0,1) 之间的浮点数
• numpy.random.random_sample(size=None)
• numpy.random.random(size=None)
• numpy.random.ranf(size=None)
• numpy.random.sample(size=None)
(5)numpy.random.choice(a, size=None, replace=True, p=None)
• 从给定的一维数组中生成随机数
•