自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 基于深度学习的跨模态检索方法

基于深度学习的跨模态检索方法基本思想利用深度学习的特征抽取能力,在底层提取不同模态的有效表示,在高层建立不同模态的语义关联。两个阶段首先,对不同模态学习单独的表示,然后利用高层网络最大化不同模态表示的相关性。文献Ngia[17] 等提出了基于深度网络的跨模态学习方法。该模型考虑了多模态融合学习、跨模态学习和共享表示学习,通过视频、语音识别证实了方法的有效性。考虑到跨模态数据的关联重点在不同模态的语义相关性,Srivastava[18] 等提出了深度玻尔兹曼机。该方法先对不同模态分别学习底层表示

2021-08-31 19:04:43 1492

原创 解决样本不均衡问题

label_id_level_1 = int(example.label_level_1) label_id_level_2 = int(example.label_level_2) samp_weight = math.sqrt(1 /label2freq_level_2[label_list_level_2[label_id_level_2]]) sample_weights.append(samp_weight)Pytorch中使用weightedRandomSampler进行样本出现概率.

2021-08-31 18:37:44 282

原创 2021-07-09 python爬取百度百科属性框

python爬取百度百科属性框from bs4 import BeautifulSoupimport requestsimport csv #用到的写入csv文件的包#初始化一个存放待爬取关键词的列表keywordlist = []#打开文件with open('qita.txt','r',encoding = 'UTF-8') as f:#逐行读取要爬取的实体名 for keyword in f.readlines(): keyword = keyword.str

2021-08-31 10:58:54 148

原创 知识图谱的抽取与构建(二)

知识图谱的抽取与构建(二)知识抽取——概念抽取知识抽取——事件识别与抽取知识抽取——概念抽取知识抽取——事件识别与抽取

2021-08-31 10:56:34 482

原创 自然语言处理:基于预训练模型的方法(一)

自然语言处理:基于预训练模型的方法1.2 自然语言处理的难点1.3 自然语言处理任务体系1.2 自然语言处理的难点1.2.1 抽象性语言是由抽象符号构成的,每个符号背后都对应着现实世界或人们头脑中的复杂概念,如“车”表示各种交通工具——汽车、火车、自行车等,它们都具有共同的属性,有轮子、能载人或物等。1.2.2 组合性每种语言的基本符号单元都是有限的,如英文仅有26个字母,中国国家标准GB2312《信息交换用汉字编码字符集·基本集》共收录6,763个汉字,即便是常用的单词,英文和中文也不过

2021-08-16 16:53:39 1001

原创 自然语言处理中的预训练模型

这里写目录标题预训练模型分类体系典型模型BertSpanBertStructBertXLNetT5GPT-3预训练模型的扩展Knowledge-Enriched PTMsMultilingual and Language-Specific PTMsCross-Lingual Language Understanding(XLU)Cross-Lingual Language Generation(XLG)Language-Specific PTMsVL-BertVideoBert模型压缩迁移到下游任务选择适当

2021-08-16 15:45:08 1219

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除