自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 注意力机制

从人工翻译句子的经验中可以的到很多启发,从而改善我们提到的串到串模型。人工翻译句子的时候,首先阅读整个句子理解要表达的意思,然后开始写出相应的翻译。但是一个很重要的方面就是在你写新的句子的时候,通常会重新回到源语言的文本,特别注意你目前正在翻译的那部分在源语言中的表达,以确定最好的翻译结果。而我们前面提到编码器的隐含层状态,这个过程像人工翻译的第一部分,而通过编码器得到最终的翻译结果,解码器处理的是翻译的第二个部分。但是“特别注意”的部分在我们的串到串模型中还没有体现,这也是需要完成的部分。为了在串到串.

2020-12-07 20:42:07 190

原创 序列处理

序列数据包括时间序列以及串数据,常见的序列有时时序数据、文本数据、语音数据等。处理序列数据的模型成为序列模型。序列模型是自然语言处理中的一个核心模型,依赖时间信息。传统机器学习方法中序列模型有隐马尔科夫模型(Hidden Markow Model,HMM)和条件随机场(Conditional Random Field.CRF)都是概率图模型,其中HMM在语音识别和文字识别领域应该广泛,CRF被广泛用于分词、词性标注和命名实体识别问题。神经网络处理序列数据。帮助我们从已知的数据中预测未来的模型,在.

2020-12-07 19:53:02 574

原创 实体关系抽取任务及其解决思路

在NLP领域中,关系抽取任务,指的是为了构建知识图谱,从结构化(表1)、半结构化(表2)非结构化数据(表3)获取形式为(事物1、关系、事物2)的三元组的活动。一些情况下,我们会想办法把关系抽取抽象成若干三元组的抽取,而不会做 四元组 、五元组的抽取。表1 若干文学形象的结构化信息结构化程度与实体关系抽取方法在确定了要抽取的实体类型、关系类型之后,就可以设计模型实现自动抽取了。随着数据的结构化程度变化,三元组抽取的方法也有所变化——总的来说,数据结构化程度越低,需要使用的方法越复杂。结构化数据的字段含

2020-11-14 21:07:34 1280

原创 关系、实体关系、实体属性、三元组、SPO三元组

关系、实体关系、实体属性、三元组、SPO三元组到底是什么呢?而提到实体关系时,小白又是什么样的心理状态呢?(到底是什么呢)三元组标注: 榆林神木 、矿藏 、 镁 三个词构成了一个三元组(triple)实体关系抽取:榆林神木 、 镁 是两个实体,而矿藏表示榆林神木 地下又大量的镁SPO三元组抽取:榆林神木 、 矿藏 、镁分别是一个句字的主语(subject)、谓语(predicate) 、宾语(object),因此是一个SPO三元组。实体属性抽取:榆林神木 是一个实体,它有一个属性,即矿藏情况。榆

2020-11-14 17:47:55 8997

原创 读取txt中某列元素中指定字符

需要得到这列数字import codecsimport re# 打开txt文件,以‘utf-8’编码读取f = codecs.open('路径', mode='r', encoding='utf-8') line = f.readline() # 以行的形式进行读取文件list1 = []while line: a = line.split() b = a[6:7] # 这是选取需要读取的位数 # 将list对象转换为字符, #不转的换就会报错因为正则.

2020-11-11 15:32:59 208

原创 torch.nn.GRUCell代码详解

小白撸代码import torch.nn as nnimport torchfrom torch.autograd import Variablernn = nn.GRUCell(10,20)#规定输入维度10 隐藏维度为20#包含输入特征的Tensor#6大行矩阵,没大行为3行10列 10是GRUCell的10input = Variable(torch.randn(6,3,10))#保存着batch中每个元素的初始化隐状态的Tensor#隐藏层为3行20列;3要和input中的3保

2020-11-11 10:01:40 5977

原创 torch.nn.GRU详解代码

小白撸代码import torch.nn as nnimport torchfrom torch.autograd import Variable# 输入是中 输入10个特征维度 隐藏是20个特征维度(输入是10列 输出是20列)一共是 2层rnn = nn.GRU(10,20,2)# print(rnn,"#####################")# 输入 一个矩阵中含有5个矩阵 每个矩阵中是3行10列 10列是GRU格式中的10列input = Variable(torch.

2020-11-11 09:42:06 6214

原创 torch.nn.LSTMCell详解代码

小白撸代码import torch.nn as nnimport torchfrom torch.autograd import Variable#LSTMCell输入10维度 隐藏状态20维度 #规定了下面输入的列数和隐藏层的列数rnn = nn.LSTMCell(10,20)#随机输入6行大矩阵 每行大矩阵为3行10列;10为LSMTMCell的10input = Variable(torch.randn(6,3,10)) # print(input)#保存着batch中每个元素的初

2020-11-11 09:36:41 1357

原创 Pytorch中的LSTM详细代码解读

小白撸代码import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimtorch.manual_seed(1)lstm = nn.LSTM(3,3) #输入dim = 3 输出dim = 3 格式是输入的是3列 隐藏层数也是3列#print(lstm)#输入inputs = [torch.randn(1,3) for _ in range(5)] #序列长度为5

2020-11-10 16:17:45 2305

原创 torch.nn.LSTM详细解读代码

小白代码解读import torch.nn as nnimport torchfrom torch.autograd import Variablelstm = nn.LSTM(10,20,2) # (1)输入的特征维度10列 (2)隐状态的特征维度20列 (3)num_layers = 2层# print(lstm)# print("***************************************************")# 输入input = Variable(torc

2020-11-09 22:41:46 1303

原创 网络结构的选择

网络结构的选择 在设计连接网络的结构时,需要确定有几层神经网络,每层神经网络有几个神经元,神经元的激活函数是什么。本篇将介绍在有监督学习的情况下如何确定网络结构 **1 欠拟合和过拟合** 神经网络的层数越多,每个层的节点越多,那么神经网络就越复杂,就越能表达更复杂的关系。存在一个问题就是数据是有限的,并且数据是有误差或有噪声的。对于有限的噪声数据,神经网络并不是越复杂越好,就涉及到了过拟合和欠拟合。 **欠拟合:**是指由于网络的复杂性不够,导致网络不能很好的完成任务。 **过拟合:**是指由于

2020-11-08 17:58:00 750 2

自己学习,请不要进行下载或者传阅

自己学习,请不要进行下载或者传阅

2023-03-24

数据集,测试集,验证集

所需要的数据集

2023-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除