深度学习入门系列(1):简单的逻辑回归模型搭建

目录

一、前言

二、参考资料与基础

三、为什么是线性回归

四、问题分析

1.建立模型

2.读入数据,得到输出

3.损失函数

4.优化算法

6.模型训练,预测标签


一、前言

       本文写于笔者入门深度学习之时,了解尚浅,只是把自己看到的、学到的分享在论坛上,有问题之处请指教,友善交流。

二、参考资料与基础

        参考资料:《动手学深度学习》

        基础:对深度学习框架有一定的认识,了解nd的基础运算、自动求导

三、为什么是线性回归

        作为机器学习的一个重要分支 —— 深度学习,通常基于神经网络模型逐级表示越来越抽象的概念或模式。对于入门者不太友好,所以我们先从线性回归和softmax回归入手,介绍深度学习的基本概念和神经网络的基本结构。

        首先介绍两种最基础的单层神经网络 —— 线性回归 和 softmax回归。

        我们通常根据神经网络的输出预测值是否离散将其分为两类问题,输出值若为连续值,则为回归问题。比如预测楼盘售价、空气湿度、地表温度等等。

        反之,输出为离散值的问题称为分类问题,例如 肿瘤良恶性判断、垃圾邮件识别·、图像分类。

        在这里,我们首先以线性回归为例,介绍深度学习模型的基本要素、表示方法。

四、问题分析

        最常见的例子便是房屋售价预测问题了。我们直到房屋价格取决于一系列因素,如:房屋状况、交通、地区安全、面积等等。在这里我们简化到两个因素,即面积和交通,则可以写出下列的数学模型。

1.建立模型

        设房屋的面积为x1,交通状况为x2,预测输出的房屋价格为 \hat{y},我们可以建立基于x1和x2来预测房屋价格的表达式,这就是模型

\hat{y} = x1w1+x2w2+b

        其中w1、w2指的是权重(weight),b是偏差(bias),其都是标量,他们都是线形回归模型的参数(parameter)

        下面我们介绍一下模型参数的生成。

from mxnet import nd, autograd
from time import time
import random
from IPython import display
from matplotlib import pyplot as plt

# 生成数据集
num_input = 2  # 特征维度
num_examples = 10000  # 样本数量
true_w = [2, -3.5]
true_b = 3.7
features = nd.random.normal(0, 1, (num_examples, num_input))
labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b
labels += nd.random.normal(0, 0.01, shape=labels.shape)


# 查看数据

        在建立了模型之后。我们需要读入数据来训练模型,计算每一次的误差,为了降低误差,我们需要引进优化算法,通过迭代完成模型参数的优化。其实在这里就已经说出了剩下的几部分:读入数据·、损失函数定义、优化算法书写、模型训练、模型预测。

2.读入数据,得到输出

        为了训练模型,我们通常会收集许多相关的数据,这个数据集被称作训练数据集(training data set),一个房屋被称作一个样本(sample),其中实际售出房屋价格为标签(label),影响房屋价格的两个因素叫做特征(feature).

        假如我们采集的样本数量为n,索引为i的样本特征为x1^{(i)} 和x2^{(i)} ,预测标签为\hat{y}^{(i)},则对于索引为i的样本,线性回归的预测表达式如下:

        \hat{y}^{(i)} = x1^{(i)}w1+x2^{(i)}w2+b

3.损失函数

        模型训练时,我们需要衡量输出预测值与真实标签的误差,通常有四种方法:0-1损失函数、 平方损失函数、绝对损失函数、对数损失函数。最常见的就是使用平方损失函数,其能够反映距离正确标签的距离。其表达式如下:

          \iota ^{(i)}(w1,w2,b) = \frac{1}{2}(\hat{y}^{(i)} - y^{(i)})^{2}

        表达式中加上1/2使求导后系数为一,使形式稍微简单一些。给定一个训练集,这个函数的值只与给模型的参数有关,在机器学习中,该函数叫做损失函数

        通常我们用训练数据集中所有样本误差的平均来衡量模型预测的质量,在模型训练中,我们的任务归根到底就是希望找出一组参数,使训练样本的平均损失最小。

4.优化算法

        关于解的问题:解析解 & 数值解

        当模型和损失函数都比较简单的时候,上面的损失函数最小化问题可以通过数学求出来,这类解叫做解析解,然而,大多数的深度学习模型都没有这一条件,只能通过优化算法有穷次的迭代来降低损失函数的值,这类解叫做数值解。

        在求解数值解的优化算法中,小批量随机梯度下降被广泛使用,其原理十分简单,这里暂不详述。迭代的过程中有两个参数需要我们自己设置:\beta(批量大小),\eta(学习率),需要强调的是,这里的批量大小、学习率均为人为设定,非模型训练产生。因此被称为超参数。当然在极少数情况下,超参数也可以通过模型训练获得,在这里不详细讨论。

具体实现:

# 读取数据集
def data_iter(batch_size, features, labels):
    num_examples = len(features)
    index = list(range(num_examples))
    random.shuffle(index)
    for i in range(0, num_examples, batch_size):
        j = nd.array(index[i: min(i + batch_size, num_examples)])
        yield features.take(j), labels.take(j)
batch_size = 10
# 查看数据
# for x, y in data_iter(batch_size,features ,labels):
#     print('\n',n,x,y)
#     break

# 定义模型
def linreg(x, w, b):
    return nd.dot(x, w) + b


# 定义损失函数
def square_loss(y_hat, y):
    return ( y_hat- y.reshape(y_hat.shape)) ** 2 / 2


# 定义优化算法
def sgd(params, lr, batch_size):
    for param in params:
        param[:] = param - lr * param.grad / batch_size

6.模型训练,预测标签

实现:

# 初始化参数
w = nd.random.normal(0, 0.01, (num_input, 1))
b = nd.zeros(1,)
w.attach_grad()
b.attach_grad()
# print(w ,b)
# 开始训练
net = linreg
loss = square_loss
lr = 0.01
epochs = 5
for epoch in range(epochs):
    for x, y in data_iter(batch_size, features, labels):
        with autograd.record():
            l = loss(net(x, w, b), y)
        l.backward()
        sgd([w, b], lr, batch_size)
    train_l = loss(net(features, w, b), labels)
    print('epoch %d , loss %f' % (epoch + 1, train_l.mean().asnumpy()))
print("用时%f sec"%(time()-stat))
print(w,true_w,'\n')
print(b,true_b)

输出结果:

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 深度学习是当今计算机科学领域最为热门的研究方向之一,其在图像分类、语言识别、自然语言处理等诸多领域都有广泛的应用。而卷积神经网络(CNN)是深度学习中最为核心的模型之一,它能够有效地提取图像的特征并进行分类。本文将介绍如何使用matlab搭建卷积神经网络。 首先,我们需要准备好所需的数据集,这是构建卷积神经网络的必要条件。可以在网上找到一些现成的数据集,如MNIST手写数字数据集,CIFAR-10图像分类数据集等等。 接下来,我们需要创建一个卷积神经网络。在matlab中,可以使用Deep Learning Toolbox来创建卷积神经网络模型。我们需要指定网络的层数、每层的神经元个数、激活函数等参数,以及网络的损失函数、优化算法等参数。 然后,我们需要将数据集分成训练集和测试集,并将其加载到matlab的工作空间中。可以使用matlab自带的数据集加载函数或者自己编写数据集加载函数来完成这一步骤。 接下来,我们需要对数据进行预处理,以便将其交给卷积神经网络进行训练。预处理包括图像的标准化、图像增强、数据扩充等操作。 最后,我们需要使用trainNetwork函数来训练我们的卷积神经网络,并使用testNetwork函数来测试网络的性能。网络训练完毕后,可以保存模型以备将来使用。 总的来说,用matlab进行卷积神经网络的搭建十分方便,并且matlab还提供了许多实用的工具箱和函数来辅助网络的训练和测试。若想深入研究深度学习,matlab是一个不错的选择。 ### 回答2: 深度学习是现代计算机科学的热门领域,它通过神经网络的层次结构来学习复杂的模式,特别是在图像、语音和自然语言处理上表现突出。Matlab是一种广泛用于数学建模、数据分析和科学计算的软件工具,也被用于深度学习领域。本文将介绍如何使用Matlab从零开始搭建卷积神经网络CNN。 首先,我们需要导入一些深度学习常用的库。例如 MatConvNet 和 VLFeat,这两个库都是由Matlab编写的,方便用户在Matlab中实现卷积神经网络。接下来,我们需要构建神经网络的模型,包括卷积层、池化层、全连接层等。这里,我们将使用卷积层、池化层交替的组合来搭建CNN模型,并设置相关的参数,例如数目、步长和大小等。 然后,我们需要准备好训练数据和测试数据,这些数据可以是图像、语音或文本等。我们需要将数据集进行预处理,例如归一化、预处理等,以确保数据数据量相等和格式标准化。接下来,我们需要定义模型的训练方法,例如使用反向传播算法以最小化误差和损失函数,而优化器可以选择常用的SGD、Adam或Adagrad等。 最后,我们需要对我们训练好的模型进行测试,测试过程中会给出一些输入样例,然后模型会输出对应的预测结果,我们可以根据这些结果来评估模型的性能和准确度。如果模型的性能不好,我们可以使用更多的层数、更多的节点或更多的数据来改善模型。 总之,使用Matlab搭建卷积神经网络的过程比较复杂,需要对深度学习的知识有一定的了解,并具备一定的程序能力。通过本文的介绍,相信读者能够初步了解到如何搭建卷积神经网络,并在实践中逐渐提高自己的能力。 ### 回答3: 在进行深度学习研究时,卷积神经网络(CNN)是一种非常常见的网络结构。使用Matlab可以高效地实现并训练CNN。下面将以一个简单的手写数字识别任务为例,从0开始介绍如何在Matlab中搭建和训练卷积神经网络。 首先需要导入手写数字数据集。在Matlab中已经内置了一个手写数字数据集,可以使用以下命令导入: ``` digitDatasetPath = fullfile(matlabroot,'toolbox','nnet','nndemos','nndatasets','DigitDataset'); imds = imageDatastore(digitDatasetPath, 'IncludeSubfolders', true, 'LabelSource', 'foldernames'); ``` 接下来,需要设置网络结构和超参数。这里选择一个包含两个卷积层和两个全连接层的CNN,同时设置学习率、迭代轮数等超参数。 ``` layers = [ imageInputLayer([28 28 1]) convolution2dLayer(3,16,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,32,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) fullyConnectedLayer(256) batchNormalizationLayer reluLayer fullyConnectedLayer(10) softmaxLayer classificationLayer]; options = trainingOptions('adam', ... 'MaxEpochs',20,... 'MiniBatchSize',128, ... 'InitialLearnRate',0.001, ... 'Shuffle','every-epoch', ... 'Verbose',false, ... 'Plots','training-progress'); ``` 然后可以开始训练模型。使用以下命令可以开始训练: ``` net = trainNetwork(imds,layers,options); ``` 最后,可以使用测试集对训练好的模型进行评估,并计算出模型的准确率: ``` YPred = classify(net,augimdsTest); YTest = imdsTest.Labels; accuracy = sum(YPred == YTest)/numel(YTest); ``` 通过这个例子,可以看出使用Matlab搭建和训练卷积神经网络是非常简单的。同时,Matlab提供了许多预训练模型和工具箱,可以方便地进行深度学习研究和应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值