错误使用 plot 向量长度必须相同。_使用scikitlearn解决监督学习任务代码示例

监督学习解决的问题 监督学习 学习两个数据集之间的联系:观测数据X和我们试图预测的外部变量 y ,通常称为“目标”或“标签”。通常情况下, y 是长度为 n_samples 的一维数组。 scikit-learn中所有的监督学习估计器都有一个用来拟合模型的 fit(X, y) 函数和输入未标记的观察值 X ,返回预测标记 ypredict(X) 方法。 分类与回归 如果预测任务是将观测值分类到一组有限的标签集合中,换句话说就是“命名”观察到的物体,则称为 分类任务。如果是预测的是连续目标变量,称为 回归任务。 在scikit learn中进行分类时, y 是整数或字符型向量。 注:请参阅 使用scikit-learn的机器学习简介教程( https://scikit-learn.org/stable/tutorial/basic/tutorial.html#introduction  )快速浏览 scikit-learn 中使用的基础机器学习概念。

最近邻分类器与维度惩罚

irises(鸢尾花)分类: 24d6d0efa3e648407b67024d69f5ee71.png iris(鸢尾花)数据集是一个分类任务,根据(Setosa, Versicolour, and Virginica)花瓣和萼片长度和宽度来对3种不同类型的鸢尾花进行分类:
>>> import numpy as np>>> from sklearn import datasets>>> iris_X, iris_y = datasets.load_iris(return_X_y=True)>>> np.unique(iris_y)array([0, 1, 2])

k近邻分类器

最近邻分类器最简单的分类器: 给定一个新的观测数据 X_test ,在训练集(即训练估计器所用的数据)中找到最接近特征向量的观测值。(有关此分类器的更多详细信息,请参阅 Scikit-learn 文档的最近邻分类器章节 https://scikit-learn.org/stable/modules/neighbors.html#neighbors 。) 训练集和测试集 在尝试使用任何机器学习算法进行实验时,最重要的是不要在用于拟合估计器的数据上测试估计器的预测值,因为这没有办法体现出估计器在 新数据上的性能。这就是为什么数据集经常被分成_train_和_test_数据的原因。 KNN (k近邻) 分类示例 : c19d6a66b0ea3746e1d21af0ad77b4eb.png
>>> # 将iris(鸢尾花)数据分成训练数据和测试数据>>> # 随机排列,使得数据随机划分>>> np.random.seed(0)>>> indices = np.random.permutation(len(iris_X))>>> iris_X_train = iris_X[indices[:-10]]>>> iris_y_train = iris_y[indices[:-10]]>>> iris_X_test = iris_X[indices[-10:]]>>> iris_y_test = iris_y[indices[-10:]]>>> # 创建和训练最近邻分类器>>> from sklearn.neighbors import KNeighborsClassifier>>> knn = KNeighborsClassifier()>>> knn.fit(iris_X_train, iris_y_train)KNeighborsClassifier()>>> knn.predict(iris_X_test)array([1, 2, 1, 0, 0, 0, 2, 1, 2, 0])>>> iris_y_testarray([1, 1, 1, 0, 0, 0, 2, 1, 2, 0])

维度惩罚

为了使估计更有效,需要根据问题本身使得相邻点之间的距离小于某个值
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值