机器学习-线性回归编程作业

最新推荐文章于 2022-07-31 20:44:59 发布

瑶麦_

最新推荐文章于 2022-07-31 20:44:59 发布

阅读量221

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/wendy0927/article/details/118880387

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、数据处理

初始化X、y
插入一列：

data.insert(0,'Ones',1)

#两种方法：
#法一：用loc，根据列名
X=data.loc[:,['Ones','Population']]
y=data.loc[:,['Profit']]

#法二：用iloc，根据列数
cols=data.shape[1]#列数，也为theta的个数
X = data.iloc[:,:-1]#X是data里的除最后列
y = data.iloc[:,cols-1:cols]#y是data最后一列

多特征可以进行先归一化处理：

#两种方法
#法一：标准差标准化，也叫z-score标准化
#x =(x - u)/σ    u是均值   σ是标准差
# std 所有数减去平均值,它的平方和除以数的个数(或个数减一),再把所得值开根号,就是1/2次方,得到的数就是这组数的标准差。
data2 = (data2 - data2.mean()) / data2.std()

#法二：Min-Max标准化
#x ＝ (x - min)/(max - min)
data2=(data2-data2.min())/(data2.max() - data2.min())

初始化其他参数
学习速率alpha = 0.01
迭代次数iters = 1500

二、代价函数

$J\left( \theta \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( {{h}_{\theta }}\left( {{x}^{(i)}} \right)-{{y}^{(i)}} \right)}^{2}}}$

def computeCost(X, y, theta):
    inner=np.power((np.dot(X,theta.T) - y),2)#矩阵乘 X为72×2，theta.T为2×1
    # 或者
    # inner = np.power(((X * theta.T) - y), 2)
    return np.sum(inner)/(2*len(X))
#这个部分计算J(Ѳ)，X是矩阵
#theta.T为theta这个矩阵的转置

三、梯度下降算法

def gradientDescent(X, y, theta, alpha, iters):
    temp = np.matrix(np.zeros(theta.shape))
    parameters = int(theta.ravel().shape[1])#theta.ravel()将数据维度变为一维
    #记录每一代中的代价函数值
    cost = np.zeros(iters)
    for i in range(iters):
        error=(X * theta.T) - y
        #遍历theta中每一个值并进行更新
        for j in range(parameters):
            term = np.multiply(error, X[:,j])#np.multiply()点乘，矩阵各个对应元素相乘
            temp[0,j] = theta[0,j] - ((alpha / len(X)) * np.sum(term))
        #更新theta和cost    
        theta = temp
        cost[i] = computeCost(X, y, theta)
    return theta, cost
#这个部分实现了Ѳ的更新

学习到了参数θ后，则可根据假设函数h(θ)进行预测：
y=θ^Tx=θ₀+θ₁x
若用到了多项式如f₁=x₁，f₂=x₂，f₃=x₁²，f₄=x₂²，……：
y=θ₀+θ₁f₁+θ₂f₂+θ₃f₃+θ₄f₄

四、正规方程

正规方程是通过求解下面的方程来找出使得代价函数最小的参数的： $\frac{\partial }{\partial {{\theta }_{j}}}J\left( {{\theta }_{j}} \right)=0$ 。
假设我们的训练集特征矩阵为 X（包含了 ${{x}_{0}}=1$ ）并且我们的训练集结果为向量 y，则利用正规方程解出向量 $\theta ={{\left( {{X}^{T}}X \right)}^{-1}}{{X}^{T}}y$ 。
上标T代表矩阵转置，上标-1 代表矩阵的逆。设矩阵 $A={{X}^{T}}X$ ，则： ${{\left( {{X}^{T}}X \right)}^{-1}}={{A}^{-1}}$

梯度下降与正规方程的比较：

梯度下降：需要选择学习率α，需要多次迭代，当特征数量n大时也能较好适用，适用于各种类型的模型

正规方程：不需要选择学习率α，一次计算得出，需要计算 ${{\left( {{X}^{T}}X \right)}^{-1}}$ ，如果特征数量n较大则运算代价大，因为矩阵逆的计算时间复杂度为 $O (n 3)$ ，通常来说当 $n$ 小于10000 时还是可以接受的，只适用于线性模型，不适合逻辑回归模型等其他模型

# 正规方程
def normalEqn(X, y):
    theta = np.linalg.inv(X.T@X)@X.T@y#X.T@X等价于X.T.dot(X)
    return theta

瑶麦_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-线性回归编程作业

一、数据处理初始化X、y插入一列：data.insert(0,'Ones',1)#两种方法：#法一：用loc，根据列名X=data.loc[:,['Ones','Population']]y=data.loc[:,['Profit']]#法二：用iloc，根据列数cols=data.shape[1]#列数，也为theta的个数X = data.iloc[:,:-1]#X是data里的除最后列y = data.iloc[:,cols-1:cols]#y是data最后一列多特征
复制链接

扫一扫

专栏目录