python代码变量作业_吴恩达的机器学习作业——Python实现,一,python

最新推荐文章于 2022-07-12 16:13:33 发布

工程师小C

最新推荐文章于 2022-07-12 16:13:33 发布

阅读量165

点赞数

文章标签： python代码变量作业

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30910893/article/details/114414616

版权

这篇博客介绍了如何使用Python进行单变量线性回归。首先，通过pandas读取'ex1data1.txt'文件并展示数据。接着，定义了代价函数、梯度函数和梯度下降法来求解最优参数θ。最终，使用可视化展示预测模型与训练数据的关系。

摘要由CSDN通过智能技术生成

单变量线性回归

数据处理

读入数据

path = 'ex1data1.txt'

data = pd.read_csv(path, names=['Population', 'Profit'])

可查看数据的一些统计量

图：数据的一些统计量

展示数据

data.plot(kind='scatter', x='Population', y='Profit', figsize=(12,8))

plt.show()

图：原数据的散点图

梯度下降

代价函数

公式：

# 计算代价函数J(θ)

def cost_function(X, y, theta):

diff = X.dot(theta.T) - y

return sum(np.power(diff, 2))/(2*m)

梯度下降法

对θ0和θ1求偏导

# 求偏导

def gradient_function(X, y, theta):

diff = X.dot(theta.T) - y

return diff.dot(X)/m

梯度下降

def gradient_descent(X, y, alpha):

theta = np.array((m,1))

gradient = gradient_function(X, y, theta)

while not all (abs(gradient) <= 1e-5):

theta = theta - alpha * gradient

gradient = gradient_function(X, y, theta)

return theta

找到的最佳的θ

进行可视化

population = np.linspace(data.Population.min(), data.Population.max(), 100) # 横坐标

profit = optimal_theta[0] + (optimal_theta[1] * population) # 纵坐标

fig, ax = plt.subplots(figsize=(8, 6))

ax.plot(population, profit, 'r', label='Prediction')

ax.scatter(data['Population'], data['Profit'], label='Training data')

ax.legend(loc=4) # 4表示标签在右下角

ax.set_xlabel('Population')

ax.set_ylabel('Profit')

ax.set_title('Prediction Profit by. Population Size')

plt.show()

源码：

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

path = 'ex1data1.txt'

data = pd.read_csv(path, names=['Population', 'Profit'])

m = len(data)

data.plot(kind='scatter', x='Population', y='Profit', figsize=(12,8))

# 计算代价函数J(θ)

def cost_function(X, y, theta):

diff = X.dot(theta.T) - y

return sum(np.power(diff, 2))/(2*m)

# 求偏导

def gradient_function(X, y, theta):

diff = X.dot(theta.T) - y

return diff.dot(X)/m

# 梯度下降

def gradient_descent(X, y, alpha):

theta = np.array((m,1))

gradient = gradient_function(X, y, theta)

while not all (abs(gradient) <= 1e-5):

theta = theta - alpha * gradient

gradient = gradient_function(X, y, theta)

return theta

X = data['Population']

y = data['Profit']

X = np.vstack((pd.Series(np.ones(m)), X)).T

alpha = 0.01

optimal_theta = gradient_descent(X, y, alpha)

print('optimal_theta:', optimal_theta)

population = np.linspace(data.Population.min(), data.Population.max(), 100) # 横坐标

profit = optimal_theta[0] + (optimal_theta[1] * population) # 纵坐标

fig, ax = plt.subplots(figsize=(8, 6))

ax.plot(population, profit, 'r', label='Prediction')

ax.scatter(data['Population'], data['Profit'], label='Training data')

ax.legend(loc=4) # 4表示标签在右下角

ax.set_xlabel('Population')

ax.set_ylabel('Profit')

ax.set_title('Prediction Profit by. Population Size')

plt.show()

本人刚开始学，才疏学浅

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python代码变量作业_吴恩达的机器学习作业——Python实现,一,python

单变量线性回归数据处理读入数据path = 'ex1data1.txt'data = pd.read_csv(path, names=['Population', 'Profit'])可查看数据的一些统计量图：数据的一些统计量展示数据data.plot(kind='scatter', x='Population', y='Profit', figsize=(12,8))plt.show()图：原数...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。