分类模型构建
分类是指构造一个分类模型,输入样本的特征值,输出对应的类别,将每个样本映射到预先定义好的类别中。分类模型若建立在已有类标记的数据集上,则属于有监督学习。在实际应用场景中,分类算法被用于行为分析,物品识别,图像检测等。
模块 | 函数 | 算法名称 |
---|---|---|
linear_model | LogisticRegression | 逻辑斯蒂回归 |
svm | SVC | 支持向量机 |
neighbors | KNeighborsClassifier | K最近邻分类 |
naive_bayes | GaussianNB | 高斯朴素贝叶斯 |
tree | DecisionTreeClassifier | 分类决策树 |
ensemble | RandomForestClassifier | 随机森林分类 |
ensemble | GradientBoostingClassifier | 梯度提升分类树 |
from sklearn.datasets import load_breast_cancer # 乳腺癌
from sklearn.model_selection import train_test_split
# 数据导出
data = load_breast_cancer()
X = data['data']
y = data['target