Table of Contents
Scikit-Learn依赖库
NumPy, SciPy, Matplotlib
安装指令
pip install scikit-learn
检查是否安装成功:
#! /usr/bin/env python
# -*- coding: utf-8 -*-
from sklearn.linear_model import LinearRegression #导入线性回归模型
model = LinearRegression()
print(model)
接口
- 所有模型提供的接口:
- model.fit(): 训练模型
- 对于监督模型来说是fit(X,y),对于非监督模型是fit(X)
- 监督模型提供的接口:
- model.predict(X_new):预测新样本
- model.predict_proba(X_new):预测概率,仅对某些模型有用(比如LR)
- model.score():得分越高,fit越好
- 非监督模型提供的接口:
- model.transform(X_new):从数据中学到新的“基空间”
- model.fit_transform():从数据中学到新的基并将这个数据按照这组“基”进行转换
实例数据集
Scikit-Learn本身提供一些实例数据,比较常见的:
- 安德森鸢尾花卉数据集Iris
- 手写图像数据集MNIST
- 世界名人图片数据集Labled Face Worldwide
以上摘自我的读书笔记_《Python数据分析与挖掘实战》
扩展阅读:如何选择合适的算法
更多可参考https://scikit-learn.org/stable/tutorial/machine_learning_map/