【深度学习详解】Task1 机器学习基础-案例学习 Datawhale X 李宏毅苹果书 AI夏令营

机动人心

已于 2024-08-27 23:59:24 修改

阅读量442

点赞数 11

分类专栏：机器学习&深度学习文章标签：人工智能深度学习机器学习 python 大数据

于 2024-08-27 23:12:24 首次发布

本文链接：https://blog.csdn.net/sk8Love956/article/details/141607148

版权

机器学习&深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

趁着《苹果书》新书发布之际，
看准开源项目 - 跟李宏毅学深度学习(入门)，
库库学~

在这里插入图片描述

❤️

系列文章导航

【深度学习详解】Task1 机器学习基础-案例学习 Datawhale X 李宏毅苹果书 AI夏令营
未完待续……

本篇目录导航

前言
系列文章导航

机器学习基础
按学习形式划分
Python 编程实现

案例学习
机器学习的三个步骤
Step 1：写出目标函数
Step 2：定义 loss损失函数
Step 3：确定权重参数偏置参数

Read more

机器学习基础

按学习形式划分

鼠标右键 -> 在新标签页中打开图像
在这里插入图片描述

Python 编程实现

在这里插入图片描述

scikit-learn 官网用户指南 12. Choosing the right estimator
https://scikit-learn.org/stable/machine_learning_map.html

准备

访问 Graphviz 的官方网站 (https://www.graphviz.org/download/) 下载并安装 Graphviz。
安装过程中，确保选择“Add application directory to your system path”选项

导入数据并处理数据

import numpy as np
import pandas as pd
# 鸢尾花数据集，红酒数据集，乳腺癌数据集，糖尿病数据集
from sklearn.datasets import load_iris,load_wine,load_breast_cancer,load_diabetes

# 回归重要指标
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error
# 分类重要指标
from sklearn.metrics import accuracy_score, confusion_matrix, f1_score, precision_recall_curve, roc_auc_score

#训练集训练集分类器
from sklearn.model_selection import train_test_split 

import graphviz #画文字版决策树的模块
import pydotplus #画图片版决策树的模块
from IPython.display import Image #画图片版决策树的模块

iris = load_iris()
print(iris.data)              # 数据I
print(iris.target_names)      # 标签名
print(iris.target)            # 标签值
print(iris.feature_names)     # 特证名(列名)

iris_dataframe = pd.concat([pd.DataFrame(iris.data),pd.DataFrame(iris.target)],axis=1)
print(iris_dataframe)

Xtrain, Xtest, Ytrain,Ytest = train_test_split(iris.data,iris.target,test_size=0.3)

随后选择对应接口创建模型，
输入数据通过 fit 方法进行训练，
然后进行 predict 并评估指标即可。

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis  # 导入LDA模型
from sklearn.svm import SVC                                           # 导入SVM模型（支持向量机）从中调用SVC模型 （支持向量机分类）
from sklearn.linear_model import LogisticRegression,LinearRegression
from sklearn.neighbors import KNeighborsRegressor,KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.tree import DecisionTreeRegressor,DecisionTreeClassifier
from sklearn.ensemble import RandomForestRegressor,RandomForestClassifier
from sklearn.ensemble import ExtraTreesRegressor,ExtraTreesClassifier
from sklearn.ensemble import AdaBoostRegressor,AdaBoostClassifier
from sklearn.ensemble import GradientBoostingRegressor,GradientBoostingClassifier

clf = RandomForestClassifier()
clf.fit(Xtrain, Ytrain)
Ypredict=clf.predict(Xtest)
print(r2_score(Ytest,Ypredict))

# 其中，决策树、随机森林等具有树形结构的基学习器可以把树形结构打印出来并保存为PDF或png文件

from sklearn import tree

clf = clf.estimators_[0]

tree_data = tree.export_graphviz(

    clf

    ,feature_names =iris.feature_names

    ,class_names = iris.target_names#也可以自己起名

    ,filled = True #填充颜色

    ,rounded = True #决策树边框圆形/方形

)

graph1 = graphviz.Source(tree_data.replace('helvetica','Microsoft YaHei UI'), encoding='utf-8')

graph1.render('./iris_tree')