NLP
醉意流年go
这个作者很懒,什么都没留下…
展开
-
MRC中答案预测实现(numpy、torch、tensorflow)
MRC问答系统中答案预测原创 2022-07-11 11:02:01 · 233 阅读 · 0 评论 -
tensoflow实现相对位置编码(relative position representation)
# coding:utf-8"""@author: liu@File: relative_pos_representation_RPR.py@CreateTime: 2021/8/17 """"""实现相对位置编码参考: https://github.com/tensorflow/tensor2tensor/blob/master/tensor2tensor/layers/common_attention.py"""import tensorflow as tfdef ge.原创 2021-08-19 17:05:28 · 995 阅读 · 0 评论 -
transformers获取和验证bert的中间层
# coding:utf-8"""@author: liu@File: get_tfbertmainlayer_demo.py@CreateTime: 2021/7/26 """import numpy as npimport tensorflow as tffrom transformers import TFBertModel, TFBertMainLayer, BertConfig, BertTokenizerbert_config = BertConfig.from_.原创 2021-07-27 11:17:14 · 1874 阅读 · 0 评论 -
keras 中lstm 和bidirectional lstm (Bilstm)的return_sequence和return_state之间的关系
import tensorflow as tftf.enable_eager_execution()embedding = tf.Variable(tf.truncated_normal((2, 3, 4)))lstm = tf.keras.layers.LSTM(units=5, return_sequences=False, return_state=False)outputs = lstm(embedding) # return_sequences=False, return_s..原创 2021-01-28 16:08:11 · 2482 阅读 · 0 评论 -
Asymmetric Loss For Multi-Label Classification 重现 【非对称损失函数】 tensorflow
应用场景:不平衡下的多标签和单标签多分类问题分为两部分:1、多标签分类def multi_label_asymmtric_loss_tf(labels, logits, gamma_pos=1, gamma_neg=4, clip=0.05, eps=1e-8, ): # 计算概率 caalculating probabilities logits_sigmoid = tf.nn.sigmoid(logits) logits_sigmoid_pos = logits_原创 2021-01-27 09:58:16 · 1955 阅读 · 3 评论 -
tensorflow 实现RBFSoftmax
参考论文:RBF_softmax:Learning Deep Representative Prototypes with Radial Basis Function Softmax"""RBF_softmax:Learning Deep Representative Prototypes with Radial Basis Function Softmax交叉熵是深度学习中非常常用的一种损失,通过交叉熵学到的特征表示会有比较大的类内的多样性。因为传统的softmax损失优化的是类内.原创 2020-09-22 11:43:56 · 395 阅读 · 0 评论 -
tensorflow 实现BahdanauAttention
class BahdanauAttention(tf.layers.Layer): def __init__(self, num_units): super(BahdanauAttention, self).__init__() self.num_units = num_units self.w1 = tf.layers.Dense(num_units) self.w2 = tf.layers.Dense(num_units) .原创 2020-07-31 16:08:59 · 549 阅读 · 0 评论 -
python word2vec 判断某个词语是否在词典中
通过Python gensim训练word2vec过程中,假如得到的模型变量是word2vecModel,判断某个词语是否在训练word2vecModel的词典中,利用下面的句子: if word in word2vecModel即可...原创 2018-08-08 16:56:04 · 8921 阅读 · 8 评论 -
NER 模型
github上的NER模型(中文)https://github.com/XierHacker/ChineseWordSegmenthttps://github.com/Determined22/zh-NER-TFhttps://github.com/baiyyang/medical-entity-recognitionhttps://github.com/hontsev/Chine...原创 2019-07-10 10:08:04 · 622 阅读 · 0 评论 -
win10下编译ltp4j
重现LTP4j(3.4.0)的编译:(首先安装maven和git,可以通过mvn -h 和git --version来查看是否安装成功)在D盘下新建ltp文件夹,按顺序执行下列命令:1、git init(若初始化过,可以省略此步骤)2、git clone https://github.com/HIT-SCIR/ltp4j.git3、cd ltp4j4、git checkout neoltp4j5、...原创 2018-04-03 18:23:25 · 1835 阅读 · 24 评论 -
window下编译ltp4j
Win10 下LTP4j的编译安装git和maven,可以在命令行窗口下通过git --version 和maven -h来观察是否安装成功在命令行下通过命令下载ltp4j文件:git clone https://github.com/HIT-SCIR/ltp4j.git(若出现fatal:not a git repository,则需要先执行git init再执行此命令)cd ltp4j(进入...原创 2018-04-03 18:18:44 · 1168 阅读 · 5 评论 -
Python训练Word2Vec和Doc2Vec
软件要求: Python3 gensim预料:中文语料,存在txt文件中 语料要求:在txt中每一行为一个文档doc,进行分词,分词之间用空格或者tab键隔开训练word2vec模型代码:import multiprocessingfrom gensim.models import Word2Vecfrom gensim.models.word2vec im原创 2017-01-05 17:39:04 · 2528 阅读 · 0 评论