![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 96
nlp
一只小菜狗:D
这个作者很懒,什么都没留下…
展开
-
BERT系列模型总结
文章目录参考TransformerTransformer-XLBERTXLNET参考NLP预训练模型:从transformer到albertXLNet:运行机制及和Bert的异同比较从语言模型到Seq2Seq:Transformer如戏,全靠MaskTransformertransformer是这些模型的基础,具体的原理+代码的介绍可以看我的博客:Transformer 代码+原理。Transformer-XLBERTXLNETXLNet: Generalized Autoregress原创 2021-12-29 16:50:53 · 1477 阅读 · 0 评论 -
Transformer 代码+原理
文章目录referencereference原创 2021-12-18 10:35:27 · 2046 阅读 · 1 评论 -
常用word embedding简介
文章目录参考word2vec参考Negative-Sampling Word-Embedding Methodword2vec原创 2021-12-16 18:06:59 · 1072 阅读 · 0 评论 -
word2vec原理+代码
文章目录参考word2vec 简单解释提速方法Hierarchical SoftmaxNegative Samplingword2vec提取关键词word2vec keras 版代码网上关于Word2vec的介绍有很多,由于在graph embedding中word2vec的广泛应用以及打算整理一版word embedding的系列内容,这里把word2vec单独拉开来讲。关于graph embedding的更多内容:graph embedding第一篇——deepwalk and linegrap原创 2021-12-08 16:02:08 · 2573 阅读 · 1 评论 -
Induction Networks for Few-Shot Text Classification
文章目录referencereference一文入门元学习(Meta-Learning)(附代码)Induction Networks for Few-Shot Text Classification原创 2021-11-28 21:50:42 · 507 阅读 · 0 评论 -
NER中的一些编码器与解码器
文章目录编码LR-CNN解码参考本篇文章是命名实体识别(NER)算法的进一步介绍,主要内容是介绍一些编码器与解码器,作为上一篇内容的补充。编码参考自中文NER的正确打开方式: 词汇增强方法总结 (从Lattice LSTM到FLAT)。关于编码部分,我想更多的介绍一些中文编码的内容。我们知道中文都是对字进行编码的,如果能够将词汇信息加入到其中,能够提供更为丰富的信息。比如在命名实体识别(NER)算法中我们介绍了Lattice LSTM就引入了词汇的信息。Lattice LSTM中存在一些缺点:原创 2021-11-19 23:00:00 · 1795 阅读 · 0 评论 -
命名实体识别(NER)算法
参考最通俗易懂的BILSTM-CRF的CRF层介绍简明条件随机场CRF介绍 | 附带纯Keras实现keras实现源码BERT标注为何不使用CRF原创 2021-11-15 22:15:00 · 7336 阅读 · 0 评论 -
关键词提取——有监督方法
在上一篇博客中,介绍了关键词提取的无监督方法:点击这里查看文章。本篇主要是介绍关键词提取的有监督方法。原创 2021-11-01 22:30:00 · 2019 阅读 · 0 评论 -
论文阅读笔记: SIFRank and BERT-KPE
文章目录SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language ModelMODEL OVERVIEWSENTENCE EMBEDDING MODEL(SIF)POSITION-BIASED WEIGHT FOR LONG DOCUMENTSCapturing Global Informativeness in Open Domain Keyphrase ExtractionMet原创 2021-10-28 18:43:25 · 2558 阅读 · 0 评论 -
结巴分词原理
文章目录结巴分词简介分词基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图构造前缀词典构造有向无环图动态规划查找最大概率路径, 找出基于词频的最大切分组合HMM识别未登陆词关键词提取TF-IDFTextRank词性标注参考在我的上一篇博客概率图模型中,有介绍一些常见的概率图模型。而在日常工作中,结巴分词也是常用的中文分词包,且其中使用了HMM模型,结合概率图模型中的理论知识,可以帮助我们进一步了解HMM算法(当然不仅限于此)。结巴分词简介首先,我们通过readme看看结巴原创 2021-10-27 19:33:04 · 1058 阅读 · 0 评论