Logistic Regression逻辑回归---梯度下降求解

最新推荐文章于 2024-02-29 15:45:27 发布

孜孜不倦就是我

最新推荐文章于 2024-02-29 15:45:27 发布

阅读量1k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_36448051/article/details/81543869

版权

本文通过实例介绍了逻辑回归模型的构建过程，使用梯度下降法求解参数。文章涵盖了数据预处理、sigmoid函数、模型构建、损失函数、梯度计算及参数更新等关键步骤，并对比了批量、随机和小批量梯度下降的差异，强调了数据标准化的重要性，最终实现约90%的预测精度。

摘要由CSDN通过智能技术生成

Logistic Regression逻辑回归—梯度下降求解

里面一些公式的推导，我有空了就会再写一篇博客
机器学习入门，这个比较简单，易懂。
链接：https://pan.baidu.com/s/1nwKe0g-U7KRoGVoTwz_fWw 密码：9ucp

问题描述

建立一个逻辑回归模型来预测一个学生是否被大学录取。
根据两次考试的结果来决定申请人是否被录取
我们拥有以前学生的历史数据，将它作为逻辑回归的训练集。（看图三）
对于每一个培训例子，决定出是否能被录取。
let’s 建立一个分类模型，根据你的考试成绩估计你能不能被录取。录取—1，未录取—0

1.数据长什么样子呢？？？

（1）用pandas读出数据

我们要用的数据，可以观察到没有列名，这是个什么鬼，仔细观察仔细仔细仔细
这里写图片描述
34.62365962451697,78.0246928153624,0
30.28671076822607,43.89499752400101,0
… 发现没有，仔细看
我们要用的数据，可以观察到有三列，没有列名，要自己指定

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os
#path = 'data' + os.sep + 'LogiReg_data.txt' #os.sep路径分隔符
path = 'LogiReg_data.txt'
pdData = pd.read_csv(path, header=None, names=['Exam 1', 'Exam 2', 'Admitted'])
print(pdData.head()) #打印前5条样本
print(pdData.shape) #打印出数据维度 100行3列

有100个样本每个样本有三个数据
这里写图片描述

（2）用matplotlib作图刻画数据（散点图scatter）

s–指描点的大小，
c–指颜色，正例（录取）用蓝色 —————-反例（未录取）用红色
marker–指样式，正例（录取）用o圈圈 —— 反例（未录取）用x 叉叉

positive = pdData[pdData['Admitted'] == 1]
# 正例returns the subset of rows such Admitted = 1, i.e. the set of *positive* examples
negative = pdData[pdData['Admitted'] == 0]
# 反例returns the subset of rows such Admitted = 0, i.e. the set of *negative* examples

fig, ax = plt.subplots(figsize=(10, 5)) #figsize指定画图域
ax.scatter(positive['Exam 1'], positive['Exam 2'], s=30, c='b', marker='o', label='Admitted')
ax.scatter(negative['Exam 1'], negative['Exam 2'], s=30, c='r', marker='x', label='Not Admitted')
ax.legend()
ax.set_xlabel('Exam 1 Score')
ax.set_ylabel('Exam 2 Score')
plt.show()