机器学习代码实践——数据——如何快速获取所需的实验数据

最新推荐文章于 2022-11-12 20:12:46 发布

Robin_Pi

最新推荐文章于 2022-11-12 20:12:46 发布

阅读量416

点赞数

分类专栏：机器学习（ML）数据分析

本文链接：https://blog.csdn.net/Robin_Pi/article/details/104511596

版权

机器学习（ML）同时被 2 个专栏收录

49 篇文章 14 订阅

订阅专栏

数据分析

36 篇文章 1 订阅

订阅专栏

与机器学习相关

数据格式

特征 X 的格式：(n_sample, n_feature)
标签 y 的格式：（n_sample , 1）

例如：对于只有一个特征的一元模型，X 的格式为（n_sample , 1），y 的格式为（n_sample, 1），而并不是（n_sample）和（n_sample）。

注意下面两种方式的区别（第二种是容许被输入到sklearn中的机器学习模型去的——不满足shape需求）

shape = (n, m) 是一个矩阵/向量！

X = 2 * np.random.rand(3, 1)
y = 4 + 3 * X + np.random.rand(3, 1)

print(X)
print(X.shape)
print()

print(y)
print(y.shape)

[[0.21245442]
 [1.82267221]
 [1.50672492]]

[[ 5.56611434]
 [10.44628077]
 [ 9.16576208]]
(3, 1)
(3, 1)

shape = (n , ) 是一行数字！

X = 2 * np.random.rand(3)
y = 4 + 3 * X + np.random.rand(3)

print(X)
print(X.shape)
print()

print(y)
print(y.shape)

[1.44855899 0.07982273 0.45481224]
(3,)

[8.37640095 4.34649373 6.1899651 ]
(3,)

通过 NumPy

如何使用NumPy快速创建我们需要的数据？

通过Sklearn

如何使用 sklearn 快速创造出我们所需的数据？

Robin_Pi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习代码实践——数据——如何快速获取所需的实验数据

目录与机器学习相关数据格式通过 NumPy通过Sklearn与机器学习相关数据格式特征 X 的格式：(n_sample, n_feature)标签 y 的格式：（n_sample , 1）例如：对于只有一个特征的一元模型，X 的格式为（n_sample , 1），y 的格式为（n_sample, 1），而并不是（n_sample）和（n_sample）。注意下面两种方式的区别（第...
复制链接

扫一扫