好吧,我标题党了,sklearn的简单也是相对于机器学习原理本身,要学好也不容易!
人工智能、机器学习,一听就是高大上的东西,想学会肯定很难。这是当然的,要理解机器学习中的各种算法模型,还是需要较强的数学功底的,这无形中提高了机器学习的门槛。但是只是要用它,却并不困难,scikit-learn的出现给程序员带来了福音,极大的降低了机器学习使用的门槛,即使你不求甚解,也能纯熟的使用各种机器学习的算法来完成自己的目标。
1 sklearn介绍
Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.
Sklearn 包含了很多种机器学习的方式:
- Classification 分类
- Regression 回归
- Clustering 非监督分类
- Dimensionality reduction 数据降维
- Model Selection 模型选择
- Preprocessing 数据预处理
我们总能够从这些方法中挑选出一个适合于自己问题的, 然后用来解决自己的问题.
scikit-learn官网:
https://scikit-learn.org/
2 一个栗子
我们还是用一个例子来直观感受一下sklearn的用法。
问题:一个分类问题,把下图所展示的红蓝点分开
怎么做呢,几行代码搞定:
from sklearn.linear_model import LogisticRegression
#初始化模型
clf_LR = LogisticRegression()
#训练数据
clf_LR.fit(features_train,label_train)
#预测
label pred_LR = clf_LR.predict(features_test)
#评估模型
acc = accuracy_score(pred_LR, label_test)
得到结果:
0.93200000000000005
我们将结果绘制出来是这样的:
plot_pic(clf_LR, features_test, label_test)
就这么简单的实现了机器学习中逻辑回归分类算法。
3 安装使用
执行安装
p