吴恩达机器学习课程笔记+代码实现(9)Python实现逻辑回归和正则化(Programming Exercise 2)

最新推荐文章于 2024-07-11 21:40:10 发布

geekxiaoz

最新推荐文章于 2024-07-11 21:40:10 发布

阅读量2.5k

点赞数 4

分类专栏：吴恩达机器学习课程笔记+代码实现文章标签：吴恩达机器学习逻辑回归正则化 python

本文链接：https://blog.csdn.net/ziqu5721/article/details/88186629

版权

本文介绍了如何使用Python实现逻辑回归，包括数据可视化、sigmoid函数、代价函数、梯度下降、正则化逻辑回归以及特征映射。通过scipy.optimize.minimize进行参数拟合，并探讨了正则化在防止过拟合中的作用。

摘要由CSDN通过智能技术生成

Programming Exercise 2: Logistic Regression

Python版本3.6
编译环境：anaconda Jupyter Notebook
链接：ex2data1.txt、ex2data2.txt 和编程作业ex2.pdf（实验指导书）
提取码：i7co
本章课程笔记部分见：逻辑回归正则化
在这一次练习中，我们将要实现逻辑回归并且应用到一个分类任务。我们还将通过将正则化加入训练算法，来提高算法的鲁棒性，并用更复杂的情形来测试它。

样本训练数据为申请入学的学生两次测评的成绩，以及最后是否被录取的结果。

%matplotlib inline
#IPython的内置magic函数，可以省掉plt.show()，在其他IDE中是不会支持的
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="whitegrid",color_codes=True)

data = pd.read_csv('ex2data1.txt', header=None, names=['Exam 1', 'Exam 2', 'Admitted'])
data.head()

	Exam 1	Exam 2	Admitted
0	34.623660	78.024693	0
1	30.286711	43.894998	0
2	35.847409	72.902198	0
3	60.182599	86.308552	1
4	79.032736	75.344376	1

数据可视化

创建两个分数的散点图，并使用颜色编码来可视化，如果样本是正的（被接纳）或负的（未被接纳）。

positive = data[data['Admitted'].isin([1])]
negative = data[data['Admitted'].isin([0])]

fig, ax = plt.subplots(figsize=(10,6))
ax.scatter(positive['Exam 1'], positive['Exam 2'], s=50, c='b', marker='o', label='Admitted')
ax.scatter(negative['Exam 1'], negative['Exam 2'], s=50, c='r', marker='x', label='Not Admitted')
ax.legend()
ax.set_xlabel('Exam 1 Score')
ax.set_ylabel('Exam 2 Score')

Text(0, 0.5, 'Exam 2 Score')

在这里插入图片描述

看起来在两类间，有一个清晰的决策边界。现在我们需要实现逻辑回归，那样就可以训练一个分类模型来预测结果。

sigmoid 函数

g 代表一个常用的逻辑函数（logistic function）为S形函数（Sigmoid function），公式为： \[g\left( z \right)=\frac{1}{1+{ {e}^{-z}}}\]
合起来，我们得到逻辑回归模型的假设函数：
\[{ {h}_{\theta }}\left( x \right)=\frac{1}{1+{ {e}^{-{ {\theta }^{T}}X}}}\]

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

nums = np.arange(-10, 10, step=0.01)

fig, ax = plt.subplots(figsize=(8,6))
ax.plot(nums, sigmoid(nums), 'r')

[<matplotlib.lines.Line2D at 0x93d7c31710>]

在这里插入图片描述

代价函数：

$J\left( \theta \right)=\frac{1}{m}\sum\limits_{i=1}^{m}{[-{ {y}^{(i)}}\log \left( { {h}_{\theta }}\left( { {x}^{(i)}} \right) \right)-\left( 1-{ {y}^{(i)}} \right)\log \left( 1-{ {h}_{\theta }}\left( { {x}^{(i)}} \right) \right)]}$

def cost(theta, X, y):
    theta = np.matrix(theta)
    X = np.matrix(X)
    y = np.matrix(y)
    first = np.multiply(-y, np

最低0.47元/天解锁文章

geekxiaoz

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录