深度学习
文章平均质量分 68
B站:阿里武
中山大学 数据科学与计算机学院 专业硕士
展开
-
Transformer 参数量计算
参考https://blog.csdn.net/weixin_43922901/article/details/102602557前言参考文献从论文本身出发进行分析, 算出了Transformer参数量,但是也需要从源码实现来进行分析Transformer 源码class ScaledDotProductAttention(nn.Module): def __init__(self): super(ScaledDotProductAttention, self).__ini原创 2021-10-19 11:07:57 · 6276 阅读 · 0 评论 -
为什么神经网络有偏置? 神经网络中的偏置(bias)究竟有这么用
转载地址https://www.zhihu.com/question/305340182/answer/721739423首先从线性方程的角度来看,假设简单的线性方程y= wx,当权重w= 1,2,3时,图形如下:不管权重怎么变换该方程所能拟合的场景都受制于原点(0,0)。当给这个方程加上截距后变成y= x + 1.方程的灵活性大大增加,拟合能力增强,所以提升了精度。在神经网络中,以sigmoid函数为例,加入偏置后也是增加了函数的灵活性,提高了神经元的拟合能力。在神经元中,output =转载 2020-12-31 16:06:23 · 6273 阅读 · 0 评论 -
Multi-modal Multi-label Emotion Detection with Modality and Label Dependence 阅读笔记
背景这篇文章讲的是多标签的情感分析, 这篇文章是考虑多模态的情感分析, 因为是多标签 所以需要考虑不同标签的依赖性,以及每个标签对不同模态的依赖性任务的具体例子是:给定一个视频,包括三个模态信息 (视觉, 文本, 声音)然后给出情感倾向(可以是多个)文章指出 多标签分类比单标签分类要更加难, 以主要挑战是如何去对标签之间的依赖性进行建模, 正如上图所说, 一个Sad 很有可能 和Disgust 是同时出现的, 但是有很小可能会出现 happy 和 sad。论文内容特征初步提取Text :原创 2020-12-30 21:38:39 · 1347 阅读 · 0 评论 -
Multistage Fusion with Forget Gate for Multimodal Summarization in Open-Domain Videos 阅读笔记
介绍这篇文章是 对一个长视频 得到一个摘要, 是属于多模态的论文.模型结构模型总体结构如图, 还是非常易懂的 经典双线程, 其中两个模态有交叉(信息交换)的地方,模型总体还算简单特征初步提取videoResNeXt-101 3D convolutional neural network 提取视频的16帧 , 然后 加入一个位置嵌入position embeddingstext使用两种方式每个单词 使用 biGRU得到单词 embedding每个单词 使用 bTrans原创 2020-12-29 23:23:14 · 674 阅读 · 0 评论 -
A Deep Learning Model for Estimating Story Points 阅读笔记
A Deep Learning Model for Estimating Story Points 阅读笔记背景与动机工作量估算是软件项目管理的重要组成部分,特别是对于计划和监视软件项目。 成本和进度超支一直是软件项目中的常见风险。 麦肯锡大学和牛津大学对5400个大型IT项目进行了研究,发现大型软件项目平均超出预算66%,加班33%。 对1,471个软件项目的另一项研究[2]显示了相似的发现:六个软件项目中有一个预算超支了200%,进度超支了近70%。 涉及工作量估算的活动是规划和管理软件项目的关键原创 2020-12-29 00:03:21 · 439 阅读 · 0 评论 -
详解Node2vec以及优缺点
1. 论文介绍首先介绍了复杂网络面对的几种任务:网络节点的分类,通俗点说就是将网络中的节点进行聚类,我们关心的是哪些节点具有类似的属性,就将其分到同一个类别中。链接预测,就是预测网络中哪些顶点有潜在的关联。但是要完成这些任务首先要解决的问题就是网络嵌入此论文设计出一种既能保持节点邻居信息和体现网络信息而且又容易训练的模型。作者发现很多节点在网络中往往有一些类似的结构特征。一种结构特征是很多节点会聚集在一起,内部的连接远比外部的连接多,作者称之为社区。另一种结构特征是网络中两个可能相聚很远的点,原创 2020-12-27 20:38:34 · 7327 阅读 · 0 评论 -
深入理解1*1卷积作用
1 . 前言1*1 卷积在很多模型结构中都使用过, 例如最出名的Inception网络其主要目的就是 进行一次1 × 1 的卷积来减少特征映射的深度.在实际操作中, 对于1*1的卷积操作, 我们可以通过改变输出的out channel 来使得输出维度的变化,也就是降维和升维, 例如 112 * 112 * 3 经过一个一维卷积 当我们的out channel 设置为32时候, 输出为112 * 112 * 32。2. 二维卷积过程概述因为1*1的卷积也是一个二维卷积, 所以我们可以先了解一原创 2020-12-27 12:05:47 · 3873 阅读 · 1 评论 -
解释:深度学习中Attention与全连接层的区别
转载地址https://www.zhihu.com/question/320174043/answer/651998472解释正如你所说的,Attention的最终输出可以看成是一个“在关注部分权重更大的全连接层”。但是它与全连接层的区别在于,注意力机制可以利用输入的特征信息来确定哪些部分更重要。举个例子:输入层有A,B,C三个特征向量,我们需要构造一层网络来确定三者的权重,然后加权求和得到输出O。也就是得到三个权重 ,然后得到 。这个式子形式上看上去确实是全连接层没错。然而如果用全连接层有什么问转载 2020-09-20 19:26:45 · 3569 阅读 · 1 评论 -
Modality to Modality Translation: An Adversarial Representation Learning阅读笔记
Modality to Modality Translation: An Adversarial Representation Learning and Graph Fusion Network for Multimodal Fusion通过使用一个新型的对抗的编码解码分类框架用于学习模态不变的嵌入空间,来减少模态之间的差异。文中用到了模态传译方面的知识,由模态传递所引发产生一个对抗的编码框架,也就是说,生成器从单一模态特征中生成一个较好的编码表示,而判别器则需要判别这个表示是否是目标模态所生成的。原创 2020-06-26 22:15:38 · 1066 阅读 · 7 评论 -
多模态的个性识别分析总结
文章目录前言总结对于video对于text使用过:对于audio 使用过对于特征提取总结前言上周我阅读了4篇关于多模态的个性分析论文,其实这些多么他的个性论文和多模态的情感分析都是一个道理,都是通过多个模态来进行分类,这是我的4篇论文的阅读笔记地址。Automatic Extraction of Personality from Text Challenges and Opportunitieshttps://blog.csdn.net/qq874455953/article/details/10原创 2020-06-05 16:50:30 · 1833 阅读 · 3 评论 -
论文阅读笔记 - Automated Screening of Job Candidate Based on Multimodal Video Processing
1. 总揽这篇文章是2017年的IEEE的会议论文,这篇论文的目的是在于减少候选者的选择时间,在招聘工作这种情形下,它的方法是通过基于视觉,听觉以及文本的三个方面的线索,用于去选择一个好的工作候选人,对于每一个方面的特征提取,使用了深度学习的算法,最后结果显示这个实验结果相较于目前的,结果有着非常好的表现。这篇文章的关键点在于三模态 、个性自动析, 下面将介绍三个模态分别使用的是怎样的方法进行特征提取以及多特征融合是怎样处理的。2. 方法提取的流程图如下:2.1 声音特征提取作者认为,情感分析原创 2020-06-04 00:42:24 · 514 阅读 · 0 评论 -
Context-Dependent Sentiment Analysis in User-Generated Videos 多模态个性分析 阅读笔记
文章目录1. 总览2. 模型结构2.1 上下文无关的特征提取2.1.1 text-CNN 提取文本特征2.1.2 openSMILE 提取声音特征2.1.3 3D-CNN 提取图像特征2.2 上下文有关的特征提取2.2.1 Contextual LSTM 结构2.3 特征融合2.3.1 非层次化的框架结2.3.1 层次化的框架结3. 结论4. 总结1. 总览这是2017年的一篇文章,ACL的会议论文。这篇文章讲的是多模态的情感分析,在当前的研究中,通常把话语当成一个独立的部分,而不考虑话语前后原创 2020-06-03 12:53:56 · 2129 阅读 · 0 评论 -
多模态个性分析论文阅读笔记Investigating Audio,Video,and Text Fusion Methods for End-to-End Automatic Personality
1. 总揽提出了一个三模态的模型结构用于从视频片段中预测大五性格不同模态使用CNN, 三个模态提取出的特征使用 FC(全连接层)进行融合,特征提取, 得到最终结果。结果显示, 相较于使用单模态, 准确率提升9.4%,证明多个模态之间的相互作用可以进一步的得到更好的模型每个模态提取的特征和每个个性特点之前有关联性2. 介绍人类对于判断一个人的性格,往往不是通过单一方面的考虑, 例如单看行为, 或者单听声音。而是各个方面的综合考虑。因此对于预测个性也应该多个地方考量, 也就是多模态问题。原创 2020-06-02 11:01:55 · 992 阅读 · 0 评论 -
使用pytorchviz进行模型可视化出现 NoneType object has no attribute grad_fn
问题最近学习pytorch, 原来用kreas重现的模型改为用pytorch实现训练,因为这样给模型的操作更加细致, 对模型的掌控更好。当我写好一个模型 出现了这个问题使用pytorchviz进行模型可视化出现r如下错误raceback (most recent call last): File "/home/jiwu/Documents/AttRCNN-CNNs/pyt_train....原创 2020-02-27 00:02:38 · 2239 阅读 · 5 评论 -
Who Am I? Personality Detection based on Deep Learning for Texts 阅读笔记
摘要这篇文章说他们认为文本的结果也是一个包含人物性格的重要特征,所以他们使用了一个名叫2CLSTM的模型,由一个双向的LSTM(Long Short Term Memory networks)和一个CNN(卷积神经网络)组成,用于侦测人物性格。同时提出**Latent Sentence Group(LSG)**这个概念来表示一组在某些方面连接很紧密的句向量。最后用这个LSG来分类得到5大性格的t...原创 2019-04-16 01:25:27 · 757 阅读 · 0 评论 -
RNN以及LSTM简介
转载地址https://blog.csdn.net/zhaojc1995/article/details/80572098本文部分参考和摘录了以下文章,在此由衷感谢以下作者的分享! https://zhuanlan.zhihu.com/p/28054589 https://blog.csdn.net/qq_16234613/article/details/79476763 http...转载 2019-04-14 23:19:56 · 823 阅读 · 0 评论 -
Deep learning-based personality recognition from text posts of online social networks 阅读笔记
文章目录一、摘要二、模型过程1.文本预处理1.1 文本切分1.2 文本统一2. 基于统计的特征提取2.1 提取特殊的语言统计特征2.2 提取基于字典的语言特征3. 基于深度学习的文本建模3.1 基于无监督学习的词嵌入3.2 基于监督学习的深度语义特征提取3.2.1 AttRCNN进行句子向量化S1. Word EmbeddingS2. 基于GRU的神经网络得到word上下文特征S2-1. 提取上文...原创 2019-04-25 01:06:25 · 783 阅读 · 0 评论 -
【深度学习】深入理解Batch Normalization批标准化
【深度学习】深入理解Batch Normalization批标准化 Batch Normalization作为最近一年来DL的重要成果,已经广泛被证明其有效性和重要性。虽然有些细节处理还解释不清其理论原因,但是实践证明好用才是真的好,别忘了DL从Hinton对深层网络做Pre-Train开始就是一个经验领先于理论分析的偏经验的一门学问。本文是对论文《Batc...转载 2019-05-09 14:53:42 · 384 阅读 · 0 评论 -
简单认识Adam优化器
转载地址https://www.jianshu.com/p/aebcaf8af76e 基于随机梯度下降(SGD)的优化算法在科研和工程的很多领域里都是极其核心的。很多理论或工程问题都可以转化为对目标函数进行最小化的数学问题。按吴恩达老师所说的,梯度下降(Gradient Descent)就好比一个人想从高山上奔跑到山谷最低点,用最快的方式(steepest)奔向最低的位...转载 2019-05-21 00:53:40 · 4281 阅读 · 0 评论 -
使用BERT进行情感分类预测及代码实例
1. BERT配置1.1. clone BERT 代码1.2. 数据处理2. 修改代码因为这次是分类问题, 所以我们需要修改run_classify.py2.1 加入新的任务类因为我们是做一个分类的任务, 但是2.2 任务类注册3. 运行代码运行代码需要提供参数, 这里我建议直接在pycharm编译器里加参数, 而不用按照官方教材 run xxx.sh4. 运行问题...原创 2019-05-17 01:46:31 · 25720 阅读 · 75 评论 -
Deep Learning-Based Document Modeling for Personality Detection from Text 阅读笔记
代码地址https://github.com/SenticNet/personality-detection综述这篇文章讲的是基于深度学习, 通过提取文本特征,得到一个人的五大性格的倾向(是/否)。 具体来说:使用CNN(卷积神经网络)对文本进行性格特征的抽取,并且在得到文档语义特征之后 将其和文档格式特征组合起来变成总特征, 然后对其进行二分类,得到结果。方法综述我们的步骤包括输入信息...原创 2019-04-12 12:57:25 · 948 阅读 · 1 评论