机器学习——单层神经网络线性回归从零实现

最新推荐文章于 2024-04-24 16:26:58 发布

CarlosFDU

最新推荐文章于 2024-04-24 16:26:58 发布

阅读量739

点赞数

分类专栏： ML学习笔记文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/weixin_38250282/article/details/84193994

版权

ML学习笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

线性回归

单层神经网络有线性回归和Softmax回归，这篇博客先讨论一下线性回归问题

线性回归：常用于预测房价、气温、销售额等连续问题
Softmax回归：常用于图像分类、垃圾邮件识别等分类问题

模型model

                  y = X*W + b

其中W为权重weight，b为偏差bias

损失函数loss function

                  l(W, b) = 1/2 * (y - ^y)^2
                  (W*, b*) = argmin(l(W, b))

算法优化

解析解analytical solution：可用公式直接表示求解
数值解numerical solution：通过优化算法有限次迭代降低loss function

本文采用的优化算法为小批量随机梯度下降mini-batch stochastic gradient descent，进行计算数值解
algorithm：先选取一组模型参数初始化，例如随机选取，本文采用高斯随机过程；接下来对参数进行多次迭代，降低loss function；在每次迭代中随机采样样本集，即min-batch；然后求小批量中数据样本的平均损失有关模型参数的导数（梯度）；最后用该值乘以学习率learning rate作为迭代减少量

算法实现

本文采用MXNet框架autograd对参数进行求导

from mxnet import nd, autograd
import random

num_inputs = 2 #特征向量维数
num_samples = 1000 #样本点数目
true_W = nd.array([2, -3.4]) #真实W值
true_b = 3.4 #真实bias
#产生均值为0，方差为1的数据
features = nd.random.normal(loc = 0, scale = 1, shape = (num_samples, num_inputs))
labels = nd.dot(features, true_W.T) + true_b
#对label加入方差为0.01的噪声
labels += nd.random.normal(loc = 0, scale = 0.01, shape = labels.shape) 
#W,b 初始化，W方差为0.01的随机产生，b为0
W = nd.random.normal(loc = 0, scale = 0.01, shape = (num_inputs, 1))
b = nd.zeros(shape=(1,))

#随机产生min-batch的数据集
def data_set(batch_size, features, labels):
    num_features = len(features)
    temp = list(range(num_features))
    random.shuffle(temp)
    
    for i in range(0, num_features, batch_size):
        j = nd.array(temp[i: min(i+batch_size, num_features)])
        yield features.take(j), labels.take(j)
   
# L2范式的损失函数
def square_loss(y_hat, y):
    return (y_hat - y.reshape(y_hat.shape)) ** 2 / 2
    
#创建W，b的梯度
W.attach_grad()
b.attach_grad()

#线性回归预测
def linreg(X, W , b):
    return nd.dot(X, W) + b

#随机梯度下降，更新参数params
def sgd(params, lr, batch_size):
    for param in params:
        #print(param.grad)
        param[:] = param - lr * param.grad / batch_size

def main():
    batch_size = 10 #min-bacth的大小
    epochs = 10 #迭代次数
    loss = square_loss
    net = linreg
    lr = 0.1 #学习率

    for epoch in range(epochs):
        for X, y in data_set(batch_size, features, labels):
            with autograd.record():
                l = loss(net(X, W, b), y) #计算loss function
            l.backward() #反向传播
            sgd([W, b], lr, batch_size) #更新参数
        train_loss = loss(net(features, W, b), labels)
        print('epoch %d, loss %f' % (epoch+1, train_loss.mean().asnumpy()))
        print(W, b)
main()

CarlosFDU

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习——单层神经网络线性回归从零实现

线性回归单层神经网络有线性回归和Softmax回归，这篇博客先讨论一下线性回归问题线性回归：常用于预测房价、气温、销售额等连续问题Softmax回归：常用于图像分类、垃圾邮件识别等分类问题模型model y = X*W + b 其中W为权重weight，b为偏差bias损失函数loss function l(...
复制链接

扫一扫