天池机器学习训练营笔记--task 01 基于逻辑回归的分类预测

最新推荐文章于 2022-05-20 15:29:07 发布

Csdnpai

最新推荐文章于 2022-05-20 15:29:07 发布

阅读量209

点赞数

分类专栏：天池训练营文章标签：机器学习 python

本文链接：https://blog.csdn.net/Csdnpai/article/details/112297356

版权

天池训练营专栏收录该内容

2 篇文章 0 订阅

订阅专栏

逻辑回归的分类预测

此笔记为阿里云天池机器学习训练营笔记，学习地址：https://tianchi.aliyun.com/specials/promotion/aicampml
感谢老师教程及阿里云提供平台

学习内容

1.理解逻辑回归理论
2.掌握逻辑回归的 sklearn 函数调用使用并将其运用到鸢尾花数据集预测
3.巩固python可视化描述操作

逻辑回归理论

逻辑回归原理简介：
Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种，分别代表两个类别，对于多分类而言，将多个二分类的逻辑回归组合），所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：
$logi(z)=\frac{1}{1+e^{-z}}$
其对应的函数图像可以表示如下: 在这里插入图片描述
逻辑回归其实是实现了一个决策边界：对于函数 $y=\frac{1}{1+e^{-z}}$ ,当 $z = > 0$ 时, $y = > 0.5$ ,分类为1，当 $z < 0$ 时, $y < 0.5$ ,分类为0，其对应的 $y$ 值我们可以视为类别1的概率预测值。

sklearn 函数调用

## 导入逻辑回归模型函数
from sklearn.linear_model import LogisticRegression

再导入iris数据集进行训练

##Demo演示LogisticRegression分类

## 构造数据集
x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])
y_label = np.array([0, 0, 0, 1, 1, 1])

## 调用逻辑回归模型
lr_clf = LogisticRegression()

## 用逻辑回归模型拟合构造的数据集
lr_clf = lr_clf.fit(x_fearures, y_label) #其拟合方程为 y=w0+w1*x1+w2*x2

## 查看其对应模型的w
print('the weight of Logistic Regression:',lr_clf.coef_)

## 查看其对应模型的w0
print('the intercept(w0) of Logistic Regression:',lr_clf.intercept_)

可视化描述操作

使用matplotlib的pyplot包画图使实验结果得以展示

## 可视化构造的数据样本点
plt.figure()
plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis')
plt.title('Dataset')
plt.show()

## 绘图函数库
import matplotlib.pyplot as plt
import seaborn as sns
`## 我们利用 sklearn 中自带的 iris 数据作为数据载入，并利用Pandas转化为DataFrame格式
from sklearn.datasets import load_iris
data = load_iris() #得到数据特征
iris_target = data.target #得到数据对应的标签
iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式

##进行浅拷贝，防止对于原始数据的修改
iris_all['target'] = iris_target

不同特征鸢尾花的品种分布：可看出特征是否独立，如果相关性大可能后期处理的时候可以剔除一个参数（比如下图花瓣长宽变量相关性较大，可以选其中一个参数来分类）


##特征与标签组合的散点可视化
sns.pairplot(data=iris_all,diag_kind='hist', hue= 'target')
plt.show()

分布可视化图
箱式图：显示数据分布，可看出数据最大最小及中位数（判断数据有没有异常，有异常的数据需要踢掉，这是训练之前所需要的一些准备）

for col in iris_features.columns:
    sns.boxplot(x='target', y=col, saturation=0.5,palette='pastel', data=iris_all)
    plt.title(col)
    plt.show()

在这里插入图片描述

Csdnpai

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
天池机器学习训练营笔记--task 01 基于逻辑回归的分类预测

逻辑回归的分类预测此笔记为阿里云天池机器学习训练营笔记，学习地址：https://tianchi.aliyun.com/s/1fc36a7e103eb9948c974f638e83a83b感谢老师教程及阿里云提供平台学习内容1.理解逻辑回归理论2.掌握逻辑回归的 sklearn 函数调用使用并将其运用到鸢尾花数据集预测3.巩固python可视化描述操作逻辑回归理论逻辑回归原理简介：Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种
复制链接

扫一扫