- 博客(21)
- 资源 (13)
- 收藏
- 关注
原创 Few-shot Learning for Multi-label Intent Detection
在本文中,我们研究了用于用户意图检测的少数快照多标签分类。对于多标签意图检测,最新的工作估计了标签实例相关性得分并使用阈值来选择帐篷标签中的多个相关标签。要确定适当的阈值,只需一个举几个例子,我们首先学习数据丰富域上的通用阈值体验,然后将阈值调整为某些基于非参数学习的校准的少数镜头域。为了更好地计算标签实例关联性得分,我们将标签名称嵌入作为表示空间中的一个关键点,从而细化了不同类别的表示,使其彼此很好地分离。在两个数据集上的实验表明,提出的模型一次都明显优于强基准和5-shot设置。
2021-01-28 18:21:13 1913 1
原创 Learning FRAME Models Using CNN Filters for Knowledge Visualization
使用CNN过滤器学习FRAME模型以进行知识可视化卷积神经网络(ConvNet或CNN)已被证明在许多任务中非常成功 就像计算机视觉领域的人一样 在此概念文件中,我们研究了可分辨CNN的生成视角。尤其是,我们建议使用CNN在卷积层预先学习的高表达滤波器来学习生成FRAME(滤波器,随机场和最大熵)模型。 我们证明了该学习算法可以在自然场景中生成逼真的丰富对象和纹理图案。我们解释说,每个学习的模型在该模型采用的过滤器层之上的一层对应一个新的CNN单元。 我们进一步证明这是可能的使用生成的CNN模型(专家模
2020-11-08 16:36:16 310
原创 Generating Images from Captions with Attention
注意从字幕生成图像基于生成模型的最新进展,我们引入了一种根据自然语言描述生成图像的模型。 提出的模型以迭代方式在画布上绘制补丁,同时注意描述中的相关单词。在接受Microsoft COCO培训后,我们将我们的模型与几个基准生成模型进行了图像生成和检索任务比较。 我们证明,与其他方法相比,我们的模型可以产生更高质量的样本,并且可以生成具有新颖场景组成的图像,这些图像与数据集中以前看不到的字幕相对应。1 引言统计自然图像建模仍然是计算机视觉和图像理解中的基本问题。这项任务具有挑战性,激发了采用深度神经
2020-11-08 15:58:22 978
原创 Order-Embeddings of Images and Language
图像和语言的顺序嵌入上位性,文本含义和图像标题可以看作是单词,句子和图像上单个视觉语义层次的特殊情况。 在本文中,我们提倡对这种层次结构的偏序结构进行显式建模。> 为了实现这一目标,我们介绍了一种学习有序表示的通用方法,并展示了如何将其应用于涉及图像和语言的各种任务。> 我们表明,所得到的表示形式相对于上调预测和图像标题检索的当前方法提高了性能。1引言计算机视觉和自然语言处理越来越紧密地交织在一起。视觉方面的最新工作已经超越了对固定对象类别的区分,而是自动生成了图像的开放式语言描述(V
2020-10-25 15:58:43 962 2
原创 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention
显示,参加和讲述:具有视觉注意的神经图像字幕生成摘要:受机器翻译和对象检测领域最新工作的启发,我们引入了一种基于注意力的模型,该模型可以自动学习描述图像的内容。> 我们描述了如何使用标准的反向传播技术,以确定性的方式训练模型,并通过最大化变分下界随机地训练模型。> 我们还通过可视化展示了模型如何能够自动学习将注视固定在显着对象上,同时在输出序列中生成相应的单词。> 我们通过三个基准数据集(Flickr8k,Flickr30k和MS COCO)的最新性能验证了注意力的使用。1.简介
2020-10-25 15:31:07 2196
原创 Expressing an Image Stream with a Sequence of Natural Sentences
用自然句序列表达图像流摘要:我们提出了一种检索图像流的自然句子序列的方法。由于普通用户经常在他们的特殊时刻拍摄一系列照片,因此最好考虑整个图像流以产生自然的语言描述。尽管几乎所有以前的研究都涉及单个图像和单个自然句子之间的关系,但我们的工作将输入和输出维度扩展到了图像序列和句子序列。为此,我们设计了一种称为相干递归卷积网络(CRCN)的多模式体系结构,它由卷积神经网络,双向递归神经网络和基于实体的局部相干模型组成。我们的方法直接从大量用户生成的博客文章资源中学习,作为文本图像并行训练数据。我们通过定量测
2020-10-18 23:28:09 317
原创 Learning like a Child: Fast Novel Visual Concept Learning from Sentence Descriptions of Images
像孩子一样学习:快速新颖的视觉概念,从图像的句子描述中学习摘要:在本文中,我们从一些带有句子描述的图像中解决了学习新颖的视觉概念及其与其他概念的相互作用的任务。利用语言环境和视觉特征,我们的方法能够有效地假设新单词的语义并将其添加到单词词典中,从而可以用来描述包含这些新颖概念的图像。我们的方法有一个基于[38]的图像字幕模块,并进行了一些改进。特别是,我们提出了一种换位的权重分配方案,该方案不仅可以提高图像字幕的性能,而且可以使模型更适合于新颖的概念学习任务。我们提出了防止过度适应新概念的方法。此外,针
2020-10-18 15:17:29 432
原创 Guiding the Long-Short Term Memory Model for Image Caption Generation
指导长时记忆以生成图像字幕摘要:在这项工作中,我们专注于图像标题生成的问题。 我们提出了长期短期记忆(LSTM)模型的扩展,简称为gLSTM。特别是,我们将从图像中提取的语义信息作为额外输入添加到LSTM块的每个单元中,目的是将模型引向更紧密地耦合到图像内容的解决方案。此外,我们探索了用于波束搜索的不同长度归一化策略,以防止偏爱短句。 在各种基准数据集(例如Flickr8K,Flickr30K和MSCOCO)上,我们获得的结果与当前的最新技术相当,甚至超越其水平。1. 简介视觉分类的最新成
2020-10-12 21:44:03 656
原创 Long-term Recurrent Convolutional Networks for Visual Recognition and Description
基于深度卷积网络的模型主导了最近的图像解释任务。我们调查了也经常使用的模型是否对涉及序列,视觉和其他方面的任务有效。我们描述了一类递归卷积体系结构,它是端到端可训练的并且适合于大规模的视觉理解任务,并展示了这些模型对于活动识别,图像字幕和视频描述的价值。与先前的模型假定固定的视觉表示或对顺序处理执行简单的时间平均相比,循环卷积模型“加倍深入”,因为它们学习时空的构图表示。当非线性被合并到网络状态更新中时,学习长期依赖性是可能的。可区分的递归模型之所以吸引人,是因为它们可以将可变长度的输入(例如视频)直接映射
2020-10-11 21:48:23 1682 1
原创 Mind‘s eye: A recurrent visual representation for image caption generation
摘要:在本文中,我们探索图像之间的双向映射及其基于句子的描述。 对于我们的方法而言,至关重要的是一个递归神经网络,它会在生成或读取字幕时尝试动态构建场景的视觉表示。 代表会自动学会记住长期的视觉概念。 我们的模型既可以在给定图像的情况下生成新颖的字幕,又可以在给定图像描述的情况下重建视觉特征。 我们在一些任务上评估我们的方法。 这些包括句子生成,句子检索和图像检索。 显示了用于生成新颖图像描述的任务的最新结果。 与人工生成的字幕相比,我们自动生成的字幕在21.0%的时间内等于或偏爱人类。 对于使用类似视觉特
2020-10-09 21:13:11 388
原创 修改热力图颜色条的字体和大小
#绘制混淆矩阵df_cm=pd.DataFrame(conmatrix,index=['消极','中性','积极'], columns=['消极','中性','积极'])plt.figure(figsize=(10,8))f, ax= plt.subplots(figsize = (10, 8))h=sns.heatmap(df_cm,annot=True,cmap="binary",fmt='.20g',ax=ax,linewidths=2, .
2020-07-10 18:10:20 14480
原创 基于矢量量化的图像压缩
引言矢量量化是19世纪70年代后期发展起来的一种数据压缩技术,其基本思想是将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。矢量量化编码也是在图像、语音信号编码技术中研究得较多的新型量化编码方法,它的出现并不仅仅是作为量化器设计而提出的,更多的是将它作为压缩编码方法来研究的。在传统的预测和变换编码中,首先将信号经某种映射变换变成一个数的序列,然后对...
2020-05-03 21:46:35 4526 2
原创 基于LSTM实现新闻文本分类
1 相关知识介绍目前对于中文语句的分析来讲,其分词技术多采用Jieba分词技术,该技术是基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);采用了动态规划(DP)查找最大概率路径,找出基于词频的最大切分组合;对于像各类专有分词、缩写词与新增词等未登录词没有收录在分词词表中,但是必须要切分出来,是采用基于汉字成词能力的HMM模型,使用了维特比(Vit...
2020-04-10 22:56:18 5871 48
原创 Sort_1000pics数据集利用CNN实现图像分类
1、数据集说明从给的Sort_1000pics数据集中了解到,该数据集中包括10类图片,对图片进行查看了解到,0-99对应与人(people);100-199对应与沙滩(beaches);200-299对应与建筑(buildings);300-399对应与大卡车(trucks);400-499对应与恐龙(dinosaurs);500-599对应与大象(elephants);600-...
2020-04-10 22:55:06 1949 27
原创 利用Sort_1000pics数据集实现图像分类
1、数据集说明从给的Sort_1000pics数据集中了解到,该数据集中包括10类图片,对图片进行查看了解到,0-99对应与人(people);100-199对应与沙滩(beaches);200-299对应与建筑(buildings);300-399对应与大卡车(trucks);400-499对应与恐龙(dinosaurs);500-599对应与大象(elephants);600-...
2020-04-10 22:43:31 2228 1
原创 AI Studio上安装TensorFlow GPU版本
AI Studio是百度开发的基于其深度学习框架paddlepaddle(飞桨)的AI一站式平台,通过为大家提供免费的顶级GPU(Tesla v100)来推广飞桨框架的,整体感觉paddle还是挺好用的,废话不多说了,接下来看下我们如何在AI studio上安装TensorFlow的GPU版本吧!Step1:打开部署的环境进入终端。Step2:新建一个文件夹来保存我们要下载的Tens...
2020-04-10 22:35:12 3226 6
原创 利用kmeans聚类算法对五大联赛球队实力进行分析
利用聚类算法对五大联赛球队实力进行分析数据整理从给的5张表中把数据进行整理,把不必要的数据进行删除,如德甲、法甲等名字;排名、场次这两列对数据的聚合影响不大进行去除,同时将红/黄牌数据列进行剔除,最后保留的信息如图1所示。正在上传…重新上传取消把5张表分别做同样的处理保留在该Excel的Sheet2表中。特别说明18-19年的数据中,德甲的数据都是总场数的数据需要转为场均数...
2020-03-09 22:34:18 2144 1
原创 Cookie+Session+Request+Response总结
Cookie总结保存在客户端中文文件下载:针对浏览器类型,对文件名字做编码处理Firefox(Base64)、IE、Chrome…使用的是URLEncoder./** 如果文件的名字带有中文,那么需要对这个文件名进行编码处理* 如果是IE ,或者 Chrome (谷歌浏览器) ,使用URLEncoding 编码* 如果是Firefox , 使用Base64编码*///获取来访的客...
2019-09-27 17:15:34 1160
原创 Http协议+Servlet+XML+Tomcat总结
Http协议总结协议:双方在交互、通讯的时候,遵守的一种规范、规则。http协议:针对网络上的客户端与服务器端在执行http请求的时候,遵守的一种规范。其实就是规范了客户端在访问服务器端的时候,要带上那些东西,服务器端返回数据的时候,也要带上什么东西。Http请求数据解释:请求行、请求头、请求体Http响应数据解析:响应行、响应头、响应体post数据是以流的方式写过去,不会在地址栏上面...
2019-09-27 17:14:53 244
原创 MySQL+JDBC+BootStrap总结
MySQL总结SQL的分类:DDL:数据库的定义,与数据库/表结构,create,drop,alterDML:数据操纵语言,操作表数据,insert,update,deleteDCL:数据控制语言,设置用户的访问权限,安全DQL:数据查询语言,select from where …数据库:创建数据库:create database …(数据库的名字)删除数据库:drop datab...
2019-09-27 17:14:21 483
原创 关于matlab 2014以前版本过期问题解决
双十一之后打开后matlab 2014以前版本过期提示%%%%%%%%%%%%%%%%%%%%%%%%%%%%INCREMENT Aerospace_Blockset MLM 99 permanent uncounted \ A05070F00D1EB1F92326 VENDOR_STRING=QQ=47399897 HOSTID=ANY \ ck=216 S
2017-11-29 21:22:30 4482
模型可视化软件.zip
2021-07-26
2015-Chen_Minds_Eye_A_2015_CVPR_paper
2020-10-09
基于双向GRU和贝叶斯分类器的文本分类
2020-06-10
基于矢量量化的图像压缩
2020-05-03
LSTM实现新闻分类.zip
2020-04-10
CNN实现图片分类.zip
2020-04-10
Bytes_SVM_决策树实现代码.zip
2020-04-10
Kmeans_class.py
2020-03-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人