Scikit-learn section2 for cvpytorch

最新推荐文章于 2024-08-15 22:56:10 发布

cvpytorch

最新推荐文章于 2024-08-15 22:56:10 发布

阅读量86

点赞数

文章标签： scikit-learn sklearn 机器学习

本文链接：https://blog.csdn.net/m0_59540543/article/details/122364155

版权

这篇博客介绍了监督学习的概念，强调了scikit-learn库中fit和predict函数在监督学习中的应用。作者通过一个k-NearestNeighbors分类器的例子展示了如何在鸢尾花数据集上进行训练和预测，并随机抽样验证了模型的准确性。尽管有些技术细节如‘维度灾难’和‘线性模型’未深入探讨，但博客鼓励读者自我探索和深入学习。

摘要由CSDN通过智能技术生成

英文官方教程链接如下：

https://scikit-learn.org/stable/tutorial/statistical_inference/index.htmlhttps://scikit-learn.org/stable/tutorial/statistical_inference/supervised_learning.html如有侵权，务必联系删除。

这一部分内容很多，不过为了保持和官网的一致性，我还是按照官网的顺序来。我觉得官网的层次划分还是十分好的，多我来说很有帮助，希望能和大家一起学习。

Supervised learning: predicting an output variable from high-dimensional observations部分

数据集，完全可以按照我的 section1 博客来看就好。

监督学习，官网给出的解释是这样的，它在于学习可观测数据和外部变量之间的关联，对外部变量进行预测。外部变量通常叫做“对象”或“标签”。(我不知道这样解释对不对，不过我一直都是这样理解的。)。scikit-learn里面所有的监督评估器都是使用 fit 函数和 predict 函数搭配的。

官方给出的有关分类和回归的定义：分类，在一组有限的标签中对观察结果进行分类；回归，目标是预测一个连续的对象变量。(我觉得大家还是看英文解释比较好，这样理解得更清楚，别人翻译的总是不太能很好地传达原来的意味。)

k-Nearest neighbors classifier

这里只是简单的描述，后面会有更深入的讲解，希望我可以跟大家一起坚持到最后。

import random
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
iris_x,iris_y = datasets.load_iris(return_X_y=True)
#如果return_X_y=True,那么返回(data,target)
#这里data对应150个实例的属性，target对应150个实例的类别，长度都是150
x_list = [i for i in range(len(iris_x))]
#创建150个实例的位置索引列表
shuffle_number1 = random.sample(x_list,len(iris_x)-10)
#随机抽取位置索引，以列表的形式返回，这里抽取140=150-10个
shuffle_number2 = random.sample(x_list,10)
iris_x_train = iris_x[shuffle_number1]
#取出对应索引的元素
iris_y_train = iris_y[shuffle_number1]
iris_x_test = iris_x[shuffle_number2]
iris_y_test = iris_y[shuffle_number2]
knn = KNeighborsClassifier()
#将分类器实例化，其实就是python类的实例化
fit = knn.fit(iris_x_train,iris_y_train)
#拟合
predict = knn.predict(iris_x_test)
预测
print(predict==iris_y_test)
#[ True  True  True  True  True  True  True  True  True  True]

事实证明这样随机抽取的分类效果要比官网上的依次抽取效果好。

The curse of dimensionality和Linear model: from regression to sparsity这块我就不说了，说实话，我没看懂。支持向量机大家也自己看看吧，官网上没有详细的可视化过程，可能到后面的深入学习部分才能弄明白。

cvpytorch

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scikit-learn section2 for cvpytorch

英文官方教程链接如下：https://scikit-learn.org/stable/tutorial/statistical_inference/index.htmlhttps://scikit-learn.org/stable/tutorial/statistical_inference/supervised_learning.html这一部分内容很多，不过为了保持和官网的一致性，我还是按照官网的顺序来。我觉得官网的层次划分还是十分好的，多我来说很有帮助，希望能和大家一起学习。Supervise
复制链接

扫一扫