初步尝试 sklearn

Scikit-learn是一个用于Python编程语言的免费软件机器学习库。 它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度增强,k均值和DBSCAN,旨在与Python数值和科学库NumPy和SciPy互操作。

安装方法很简单 `pip3 install -U scikit-learn`

下面介绍一个简单的栗子,初步尝试sklearn。

sklearn有自带的数据集,直接导入就好,首先导入相关库

1from sklearn import datasets
2from sklearn.model_selection import train_test_split
3from sklearn.neighbors import KNeighborsClassifier

导入鸢尾花数据集

1iris = datasets.load_iris()
2iris_X = iris.data
3iris_y = iris.target
4
5print(iris_X[:5], '\n\n',iris_y)

输出:

观察一下数据集,X 有四个属性,y 有 0,1,2 三类。把数据集分为训练集和测试集,其中 test_size=0.3,即测试集占总数据的 30%。

1X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.3)

Sklearn-train_test_split,会随机划分训练集和测试集。

查看下我们的数据

下一步就可以模型,然后用train数据训练得到模型,最后用模型来预测数据。

1knn = KNeighborsClassifier()
2knn.fit(X_train, y_train)
3X_predict = knn.predict(X_test)

可以看到大概模拟出了数据,但是有误差,是不会完完全全预测正确的。

模型sklearn已经很完善,调参和数据处理就很重要了。

sklearn 非常强大,值得好好钻研下。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器学习模型机器
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值