面向城市人群流量预测的深度时空残差网络[名词解释]

前言

本文为基于论文《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》的一些名词解释,该论文的翻译在昨天发出,总体为机翻,但我看了这篇论文,将其进行了人工润色。以下为对于其中一些名词的解释。

[1]端到端的结构:

输入直接映射到输出,没有中间步骤或人为干预。这种方法的核心思想是将整个任务或流程作为一个单一的系统来优化和执行,而不需要手动处理中间步骤或特征工程。

[2]残差神经网络

残差的使用主要是由于直接进行学习容易导致梯度的爆炸或消失,使用残差块,不直接学习映射,而是学习与输入的差值,可以有效缓解梯度消失和梯度爆炸,从而使深度学习可以支撑深度更大的神经网络。

残差块具有多种结构,其本质就是一个基本块加上输入X的值产生输出。

本质就是几个基本块的输出结果加上输入X

文中使用的残差块

下图为文中使用的基本残差单元,即输入经过ReLU激活,然后进行卷积操作提取空间特征,再通过ReLU激活,再使用卷积层,之后与输入相加,得到模块的输出。即X->ReLU->Conv->ReLU->Conv

变体L12-single-E去掉一个ReLU和Conv,结构为X->ReLU->Conv

变体L12-E-BN添加两个BN(Batch Normalization),结构为X->BN->ReLU->Conv->BN->ReLU->Conv

[3]加性残差函数

即指残差函数,加性是为说明其作用是添加到输入X上形成输出。

[4]Logistic函数

Logistic函数即sigmoid函数,为\sigma(x) = \frac{1}{1 + e^{-x}},函数值变化敏感,一旦接近或者超出区间就失去敏感性。

图像为:

tanh函数是双曲正切函数,为\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}},能够保持非线性单调上升和下降关系,但比Logistic延长了饱和期。

图像为:

[5]子采样

通过减少采样率来降低数据的分辨率或密度。此处指在样本不均衡的情况下,子采样可以指从多数类别(majority class)中随机选择一部分样本,使得与少数类别(minority class)的样本数量接近,从而平衡数据集,提高分类器的性能。

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值