与机器学习相关
数据格式
特征 X 的格式:(n_sample, n_feature)
标签 y 的格式:(n_sample , 1)
例如:对于只有一个特征的一元模型,X 的格式为 (n_sample , 1),y 的格式为(n_sample, 1),而并不是 (n_sample)和(n_sample)。
注意下面两种方式的区别(第二种是容许被输入到sklearn中的机器学习模型去的——不满足shape需求)
- shape = (n, m) 是一个矩阵/向量 !
X = 2 * np.random.rand(3, 1)
y = 4 + 3 * X + np.random.rand(3, 1)
print(X)
print(X.shape)
print()
print(y)
print(y.shape)
[[0.21245442]
[1.82267221]
[1.50672492]]
[[ 5.56611434]
[10.44628077]
[ 9.16576208]]
(3, 1)
(3, 1)
- shape = (n , ) 是一行数字!
X = 2 * np.random.rand(3)
y = 4 + 3 * X + np.random.rand(3)
print(X)
print(X.shape)
print()
print(y)
print(y.shape)
[1.44855899 0.07982273 0.45481224]
(3,)
[8.37640095 4.34649373 6.1899651 ]
(3,)