2021年08月_StellaLiu萤窗小语

原创基于深度学习的跨模态检索方法

基于深度学习的跨模态检索方法基本思想利用深度学习的特征抽取能力，在底层提取不同模态的有效表示，在高层建立不同模态的语义关联。两个阶段首先，对不同模态学习单独的表示，然后利用高层网络最大化不同模态表示的相关性。文献Ngia[17] 等提出了基于深度网络的跨模态学习方法。该模型考虑了多模态融合学习、跨模态学习和共享表示学习，通过视频、语音识别证实了方法的有效性。考虑到跨模态数据的关联重点在不同模态的语义相关性，Srivastava[18] 等提出了深度玻尔兹曼机。该方法先对不同模态分别学习底层表示

2021-08-31 19:04:43 1492

原创解决样本不均衡问题

label_id_level_1 = int(example.label_level_1) label_id_level_2 = int(example.label_level_2) samp_weight = math.sqrt(1 /label2freq_level_2[label_list_level_2[label_id_level_2]]) sample_weights.append(samp_weight)Pytorch中使用weightedRandomSampler进行样本出现概率.

2021-08-31 18:37:44 282

原创 2021-07-09 python爬取百度百科属性框

python爬取百度百科属性框from bs4 import BeautifulSoupimport requestsimport csv #用到的写入csv文件的包#初始化一个存放待爬取关键词的列表keywordlist = []#打开文件with open('qita.txt','r',encoding = 'UTF-8') as f:#逐行读取要爬取的实体名 for keyword in f.readlines(): keyword = keyword.str

2021-08-31 10:58:54 148

原创知识图谱的抽取与构建（二）

知识图谱的抽取与构建（二）知识抽取——概念抽取知识抽取——事件识别与抽取知识抽取——概念抽取知识抽取——事件识别与抽取

2021-08-31 10:56:34 482

原创自然语言处理：基于预训练模型的方法（一）

自然语言处理：基于预训练模型的方法1.2 自然语言处理的难点1.3 自然语言处理任务体系1.2 自然语言处理的难点1.2.1 抽象性语言是由抽象符号构成的，每个符号背后都对应着现实世界或人们头脑中的复杂概念，如“车”表示各种交通工具——汽车、火车、自行车等，它们都具有共同的属性，有轮子、能载人或物等。1.2.2 组合性每种语言的基本符号单元都是有限的，如英文仅有26个字母，中国国家标准GB2312《信息交换用汉字编码字符集·基本集》共收录6，763个汉字，即便是常用的单词，英文和中文也不过

2021-08-16 16:53:39 1001

原创自然语言处理中的预训练模型

这里写目录标题预训练模型分类体系典型模型BertSpanBertStructBertXLNetT5GPT-3预训练模型的扩展Knowledge-Enriched PTMsMultilingual and Language-Specific PTMsCross-Lingual Language Understanding(XLU)Cross-Lingual Language Generation(XLG)Language-Specific PTMsVL-BertVideoBert模型压缩迁移到下游任务选择适当

2021-08-16 15:45:08 1219

anqi3776的博客

原创基于深度学习的跨模态检索方法

原创解决样本不均衡问题

原创 2021-07-09 python爬取百度百科属性框

原创知识图谱的抽取与构建（二）

原创自然语言处理：基于预训练模型的方法（一）

原创自然语言处理中的预训练模型

空空如也

空空如也

原创 基于深度学习的跨模态检索方法

原创 解决样本不均衡问题

原创 2021-07-09 python爬取百度百科属性框

原创 知识图谱的抽取与构建（二）

原创 自然语言处理：基于预训练模型的方法（一）

原创 自然语言处理中的预训练模型

空空如也

空空如也

原创基于深度学习的跨模态检索方法

原创解决样本不均衡问题

原创知识图谱的抽取与构建（二）

原创自然语言处理：基于预训练模型的方法（一）

原创自然语言处理中的预训练模型