在这一部分中,你将用多元线性回归来预测房价。假设你正在出售你的房子,你想知道一个好的市场价格是什么。一种方法是首先收集最近出售的房屋的信息,并建立房价模型。文件ex1data2.txt包含俄勒冈州波特兰的房价培训集。第一列是房子的大小(以平方英尺为单位),第二栏是卧室的数量,第三栏是房子的价格。
一 多元线性回归
1-1 多元方程
多元线性回归指的就是有多个X的情况。比如与房价y有关的变量有:房屋面积x1,位置x2。
此时,我们就要把我们的方程 hθ(x)=θ0+θ1∗x 修改为:
hθ(x)=θ0+θ1x1+θ2x2+⋯+θnxn
其实本质并没有变,就是变量x多了,所以参数θ也跟着多了。但是思想还是没有变:通过误差函数,经过梯度下降求参数。
为了结构统一,我们设 x0=1 ;此时方程应为:
hθ(x)=θ0+θ1x1+θ2x2+⋯+θnxn=θTx
如此一来,便将变量向量化了。也变得和第一章的一样了。
import matplotlib.pyplot as plt
import numpy as np
#导入数据
data=np.loadtxt('ex1data2.txt',delimiter=',',dtype=np.int64)
data=np.matrix(data)
X=data[:,0:2]
y=data[:,2]
m=y.size
X=np.c_[np.ones(m),X]
theta=np.matrix([0,0,0])
part1:特征归一化