论文
哈特谢普苏特
海上生明月
展开
-
论文学习-使用LSTM递归神经网络架构的紧急事件预测
摘要传统的EV事件(紧急事件预测)方法是时间序列分析技术,包括移动平均和自回归移动平均。在本文中我们使用基于递归神经网络RNN的EV预测结构,尤其是LSTM结构本文LSTM的主要框架是首先进行空间聚类(根据区域选择聚类),然后进行空间聚类独立或依赖性研究(如果是独立,只需要考虑本区域的数据,如果是依赖,则需要考虑其它区域的数据),最后进行LSTM预测,其中本文中的LSTM可以用于处理EV事件中的...转载 2018-03-09 19:57:14 · 1650 阅读 · 0 评论 -
2018年论文总结
2018年开始接触看论文,一年下来看了不少,在此总结1.Practical Block-wise Neural Network Architecture Generation2.Learning Face Age Progression: A Pyramid Architecture of GANs3.deep layer aggregation4.ECO: Efficien...原创 2019-03-18 15:14:09 · 322 阅读 · 0 评论 -
Music Signal Processing Using Vector Product Neural Networks论文翻译
我们提出了一种新的神经网络模型,用于使用矢量积神经元和维度变换进行音乐信号处理。 这里,输入首先从实际值映射到三维矢量,然后馈入三维矢量乘积神经网络,其中输入,输出和权重都是三维值。 接下来,最终输出将映射回实数。 提出了两种维数变换方法,一种是通过上下文窗口,另一种是通过光谱着色。 用于盲唱语音分离的iKala数据集的实验结果证实了我们模型的有效性。Introduction近年来,深度学...翻译 2019-03-11 16:29:34 · 364 阅读 · 0 评论 -
SINGING-VOICE SEPARATION FROM MONAURAL RECORDINGS USING DEEP RECURRENT NEURAL NETWORKS论文翻译
基于深度循环神经网络(DRNN)的单通道音乐人声分离ABSTRACT单声道源分离对于许多现实世界的应用是重要的。 由于只有单一频道信息可用,因此具有挑战性。 在本文中,我们探索使用深度递归神经网络在监督环境中从单声道录音中分离歌声。 深入研究了具有不同时序神经网络。我们建议通过将分离步骤包括在最后一层中作为非线性操作来联合优化多个源信号的网络。 进一步探讨了不同的判别训练目标,以提高源干...翻译 2019-03-11 18:31:42 · 1320 阅读 · 0 评论 -
Neural Style Transfer: A Review
这篇是风格转移方面的综述,文中总结了多种风格转移的方法。因为18年看过很多风格转移方面的论文,因此翻译这篇综述。Gatys等人的开创性工作。通过分离和重新组合图像内容和风格,展示了卷积神经网络(CNN)在创作艺术图像方面的力量。使用CNN以不同样式呈现内容图像的该过程被称为神经样式转移(NST)。从那时起,NST已经成为学术文献和工业应用中的热门话题。它正在受到越来越多的关注,并且提出了各种方...翻译 2019-03-18 15:13:42 · 4106 阅读 · 0 评论 -
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks笔记
ICCV2017论文“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”此文章的提出主要是为了解决一个问题—— image-to-image translation中一对一的训练数据较难获得。一般的训练,生成图像总是要与某个gound truth完全相等(pair),而这种gound ...翻译 2019-05-26 09:01:23 · 246 阅读 · 0 评论 -
Generative Adversarial Nets笔记
GAN开山之作,论文中大量数学证明。链接https://arxiv.org/abs/1406.2661摘要我们提出了一个通过对抗过程估计生成模型的新框架,在新框架中我们同时训练两个模型:一个用来捕获数据分布的生成模型G,和一个用来估计样本来自训练数据而不是G的概率的判别模型D,G的训练过程是最大化D产生错误的概率。这个框架相当于一个极小化极大的双方博弈。在任意函数G和D的空间中存...翻译 2019-05-26 10:57:19 · 269 阅读 · 0 评论 -
DCGAN
https://blog.csdn.net/liuxiao214/article/details/74502975https://blog.csdn.net/liuxiao214/article/details/73500737https://blog.csdn.net/czp_374/article/details/81199055重点:DCGAN基本结构和最原始的GAN是类似...原创 2019-05-26 14:39:01 · 942 阅读 · 0 评论 -
WaveNet笔记
直接在原始音频波形上处理特色是使用带洞因果卷积处理音频(dialated causal convolutions)因果卷积:果卷积的意义就是WaveNet在生成t时刻的元素时,只能使用0到t-1时刻的元素值。在WaveNet中利用,output输出只利用了之前的元素来生成。由于声音文件是时间上的一维数组,16KHz的采样率的文件,每秒钟就会有16000个元...原创 2019-05-27 15:04:21 · 524 阅读 · 0 评论 -
论文阅读Learning Face Age Progression: A Pyramid Architecture of GANs
这篇论文主要是为了解决在人脸预测的时候同时保留年龄特征和身份特征,使用GAN网络,以及金字塔模型。与以前的方法相比,还提到了前额和头发在年老时候的影响,同时可以在化妆以及不同姿态下进行预测。Abstract面部年龄进展的两个基本要求,即老化准确性和身份持久性,在文献中没有得到很好的研究。在本文中,我们提出了一种新的基于生成对抗网络的方法。它分别模拟内在受试者特征和年龄特定面部变化相对于经过...原创 2018-12-09 17:12:23 · 998 阅读 · 0 评论 -
论文阅读Practical Block-wise Neural Network Architecture Generation
这篇论文只要通过强化学习中的Q-learning来搜索最优的神经网络的block构架方法。大多数的CNN都是人工设计的,有大量的超参数需要选择,而以前提出的自动网络设计方法往往效果不好or需要花费大量的时间,而且只能解决特定的任务,不能很好的泛化。因此提出了blockQNN。主要思路是设计了一个block structure:因为以前的方法需要很大的搜索空间,而本文提出一种基于block-...原创 2018-12-03 21:34:04 · 683 阅读 · 0 评论 -
Localization of emergency acoustic sources bymicro aerial vehicles
前人做的一些研究:本文已经完成的工作:在听觉方面的科学研究中,人们多集中在研究语音识别,说话人的定位,以及类人机器人。用声音进行紧急声源定位的研究比较少。这些研究中,经常用到的一个方法是TDOA:具体介绍一下文章中的三种方法:以下文章的结构:首先对TDOA进行研究,进行相关测量和方向估计:如上图所示,利用数学关系,可以计算出由于两个麦克风信号有N个样本,因此它们之间的相关性:对上式进行逆傅里叶变化...原创 2018-03-16 15:41:14 · 196 阅读 · 0 评论 -
论文学习学习1
BSN:BoundarySensitiveNetworkforTemporalAction ProposalGeneration用于时序动作提名生成的边界敏感网络这张图是这篇论文的流程,大体总结如下:首先将视频分为S小段,每段随机选取一帧,提取RGB和光流信息,分别编码后形成二维的F特征,这是BSN网络的输入。接下来进入BSN网络正题,首先是时序评估模块。采用三层的时序卷积网络对输...原创 2018-09-10 21:29:26 · 1593 阅读 · 0 评论 -
Non-local Neural Networks
这篇paper主要解决长期依赖问题,因为卷积网络中使用的卷积3*3比较小,只能捕捉到局部信息,如果捕捉长期依赖信息需要多次重复,效率低。主要思想是计算某一位置的所有映射相应,选取最高的响应(我们的非局部操作将位置处的响应计算为所有位置处的特征的加权和)。如上图所示,位置xi的响应由所有位置xj的特征的加权平均值计算(这里仅显示最高的加权平均值)。在我们的模型计算的这个例子中,请注意它如何将...原创 2018-10-15 20:02:44 · 373 阅读 · 0 评论 -
Deep Residual Learning for Image Recognition 论文学习
Deep Residual Learning for Image Recognition 这篇paper讲的是残差网络,用于简化非常深的网络,该框架层能根据输入来学习残差函数而非原始函数。深度网络存在的梯度消失爆炸问题通过BN得到了有效解决,出现的另一个问题是网络的退化问题,这是指当网络深度加深时,准确率提高,随之下降。并且这种下降并不是因为过拟合,因为我们假设深层网络是从浅层网络直接复制来的,理...原创 2018-10-16 12:37:13 · 533 阅读 · 0 评论 -
论文学习Unsupervised Person Image Synthesis in Arbitrary Poses
Unsupervised Person Image Synthesis in Arbitrary Poses任意姿态无监督的人的图像合成Abstract我们提出了一种新颖的方法来合成使用生成敌对学习的任意姿势的人的照片真实感图像。给定一个人的输入图像和二维骨架所代表的所需姿势,我们的模型在新姿势下渲染同一人的图像,合成输入图像中可见部分的新视图,并幻想那些看不到的部分。这个最近已经以监...原创 2018-10-22 19:53:20 · 807 阅读 · 1 评论 -
论文学习- Convolutional Pose Machines 卷积位姿机
AbstractPose Machines提供了一个顺序预测框架,用于学习丰富的隐式空间模型。在这项工作中,我们展示了如何将卷积网络结合到用于学习图像特征的姿势机器框架和用于姿势估计任务的图像相关空间模型的系统设计。本文的贡献是隐式地模拟结构化预测任务中变量之间的长程依赖关系,例如关节姿态估计。我们通过设计一个由卷积网络组成的顺序架构来实现这一目标,该卷积网络直接在前一阶段的信念图上运行,为部...原创 2018-10-29 17:20:21 · 2120 阅读 · 0 评论 -
Person Transfer GAN to Bridge Domain Gap for Person Re-Identification论文阅读
题目Person Transfer GAN to Bridge Domain Gap for Person Re-Identification摘要本文提出了一种针对于ReID的生成对抗网络PTGAN,可以实现不同ReID数据集的行人图片迁移,在保证行人本体前景不变的情况下,将背景转换成期望的数据集style。另外本文还提出一个大型的ReID数据集MSMT17,这个数据集包括多...原创 2018-11-18 20:33:22 · 505 阅读 · 0 评论 -
Deep Layer Aggregation论文阅读
深层聚合 主要是解决深层网络中各层之间的联系问题,认为原来的“slip”太浅,不能很好的学习和保存原来的信息,于是提出DLA,分为IDA(迭代深度聚合)和HDA(分层深度聚合),使用更好的参数提高分辨率,前者统合分辨率和规模,遵循基础层次来逐步确定分辨率和聚合规模,后者合并所有模块和渠道的功能,汇集了自己的树状结构连接层次结构,这些连接交叉合并阶段以聚合不同级别的表示。DLA可广泛应用于大规模图像...原创 2018-11-25 13:52:49 · 1602 阅读 · 0 评论 -
StarGAN-VC2: Rethinking Conditional Methods for StarGAN-Based Voice Conversion
该论文链接原文地址发表于Interspeech 2019总体概括:1.使用了很多损失函数 对抗 分类(区别人) 身份(进一步对目标的映射)循环一致性损失 ,这些损失都来源于STARGA 以及Cycle-GAN。2.一对多 其它很多是一对一 该方法是一对多 此处对应损失函数分类和身份 循环一致性损失 3.非平行数据 同时论文中表明为何使用非平行数据,因为平行...原创 2019-10-11 14:36:08 · 1956 阅读 · 0 评论