#coding = urf-8
import numpy as np
us_data = "./youtube_video_data/US_video_data_numbers.csv"
uk_data = "./youtube_video_data/UK_video_data_numbers.csv"
#加载国家数据
us_data = np.loadtxt(us_data, delimiter=",", dtype=int)
uk_data = np.loadtxt(uk_data, delimiter=",", dtype=int)
#添加国家信息
#构造全为0的数据
zeros_data = np.zeros((us_data.shape[0],1)).astype((int)
ones_data =np.ones((uk_data.shape[0],1)).astype(int)
#分别添加一列全为0,1的数组
us_data = np.hstack((us_data, zeros_data))
uk_data = np.hstack((us_data, ones_data))
#拼接两组数据
final_data = np.vstack((uk_data,uk_data))
print(final_data)
numpy中更多的好办法
-
获取最大值最小值的位置
np.argmax(t,axis=0)
np.argmin(t,axis=1) -
创建一个全0的数组: np.zeros((3,4))
-
创建一个全1的数组:np.ones((3,4))
-
创建一个对角线为1的正方形数组(方阵):np.eye(3)
参数 | 解释 |
---|---|
.rand(d0,d1,…dn) | 创建d0-dn维度的均匀分布的随机数数组,浮点数,范围为0-1 |
.randn(d0,d1,…dn) | 创建d0-dn维度的标准正态分布随机数,浮点数,平均数0,标准差1 |
.randint(low,high,(shape)) | 从给定上下限范围选取随机数整数,范围是low,high,形状是shape |
.unifrom(low,high,(size)) | 产生具有均匀分布的数组,low起始值,high结束值,size形状 |
.normal(loc,scale,(size)) | 从指定正态分布中随机抽取样本,分布中心是loc(概率分布的均值),标准差是scale,形状是size |
.seed(s) | 随机数种子,s是给定的种子值。因为计算机生成的是伪随机数,所以通过设定相同的随机数种子,可以每次生成相同的随机数 |