机器学习(一):低纬数据可视化
(第一次写博客,后续相关学习任务应该会继续发布)
任务要求
1.安装软件python和工具包sklearn
①安装python,可以直接从官网https://www.python.org/进行下载
②sklearn包可以通过pip install sklearn命令进行安装(若安装失败,可能是pip未升级,
可通过’python -m pip install --upgrade pip’ 进行升级)
2.生成数据 make_circles和make_moons,并显示X=400x2,Y = {0, 1}400
① make_circles函数
sklearn.datasets.make_circles(n_samples=100, shuffle=True,
noise=None, random_state=None, factor=0.8)
作用是生成一个二维的大圆,包含一个小圆
相关参数说明:
n_samples:整数 可选 默认为100生成的总点数。(如果是奇数,内圆比外圆多一点,但是测试输入5后,内圆和外圆均是两个点)
shuffle:布尔变量 可选 默认为True,是否打乱样本。
noise:double或None ,默认为None,将高斯噪声的标准差加入到数据中。
random_state:整数 RandomState instance or None,确定数据集变换和噪声的随机数生成。
factor:0 < double < 1 默认值0.8,内外圆之间的比例因子。
② make_moons函数
x,y = datasets.make_moons(n_samples=800,noise=None,shuffle=False,random_state=None)
相关参数说明:
n_numbers:生成样本数量
shuffle:数据是否打乱
noise:默认是false,数据集是否加入高斯噪声
random_state:生成随机种子,给定一个int型数据,能够保证每次生成数据相同。
③代码