线性回归其实就是从一堆训练集中去算出一条线,使数据集到线之间的距离差最小。
操作,若是一元直线则设然后求出每组的h(x),然后求每组估计值和真实值差的和得然后求它的最小值
(1)得出θ0和θ1,就可以求出这个线性回归式
θ0和θ1如何求?
loss对θ0偏导=0以及loss对θ1偏导=0
若是曲线模型,同上
(2)运用梯度下降,构建一个立体图形
θ0,θ1为x,y轴,loss为z轴
若想简单计算则设为
然后求J(θ)对θ0和θ1分别偏导,求出新的θ0和θ1
`# -- coding: utf-8 --
“”"
Created on Wed Jun 20 17:09:13 2018
@author: 96jie
“”"
#导入cv模块
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
#数据
a = np.random.standard_normal((1, 500))
x = np.arange(0,50,0.1)
y = np.arange(20,120,0.2)
y = y - a*10
y = y[0]
#梯度下降
def Optimization(x,y,theta,learning_rate):
for i in range(iter):
theta = Updata(x,y,theta,learning_rate)
return theta
def Updata(x,y,theta,learning_rate):
m = len(x)
sum = 0.0
sum1 = 0.0
alpha = learning_rate
h = 0
for i in range(m):
h = theta[0] + theta[1] * x[i]
sum += (h - y[i])
sum1 += (h - y[i]) * x[i]
theta[0] -= alpha * sum / m
theta[1] -= alpha * sum1 / m
return theta
#数据初始化
learning_rate = 0.001
theta = [0,0]
iter = 1000
theta = Optimization(x,y,theta,learning_rate)
plt.rcParams[‘font.sans-serif’]=[‘SimHei’]
plt.rcParams[‘axes.unicode_minus’] = False
‘’’
plt.figure(figsize=(35,35))
plt.scatter(x,y,marker=‘o’)
plt.xticks(fontsize=40)
plt.yticks(fontsize=40)
plt.xlabel(‘特征X’,fontsize=40)
plt.ylabel(‘Y’,fontsize=40)
plt.title(‘样本’,fontsize=40)
plt.savefig(“样本.jpg”)
‘’’
#可视化
b = np.arange(0,50)
c = theta[0] + b * theta[1]
plt.figure(figsize=(35,35))
plt.scatter(x,y,marker=‘o’)
plt.plot(b,c)
plt.xticks(fontsize=40)
plt.yticks(fontsize=40)
plt.xlabel(‘特征X’,fontsize=40)
plt.ylabel(‘Y’,fontsize=40)
plt.title(‘结果’,fontsize=40)
plt.savefig(“结果.jpg”)`