![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 82
薇酱
=。=
展开
-
FastText-PVDM,Distributed Representations of Sentences and
https://github.com/aiweiw/fasttext-PVDM原创 2021-05-30 23:49:48 · 224 阅读 · 0 评论 -
FastText使用指南
官方使用指南:https://fasttext.cc/docs/en/unsupervised-tutorial.html除了word2vec之外,fastText是谷歌开源的另一款计算词向量的工具。性能比肩深度网络且训练速度更快,处理计算词向量之外,它还支持文本分类,引入了子词(subword)概念,对训练样本中未见过的词也能有很好的预测结果。(对于英文来说,前缀或者是后缀相同的词往往有着相近的意思,对于中文lai'sh)一.文本分类训练: ./fasttext supervised -inp原创 2021-05-23 18:49:11 · 792 阅读 · 2 评论 -
Word2vec原理+常见优化手段
官网地址:https://code.google.com/archive/p/word2vec/我觉得原理讲的比较好的:https://www.cnblogs.com/pinard/p/7160330.html最近发现学习知识还是尽量找官网的解释,比较全,别人讲过的会帮助你理解,但是会漏掉一些知识word2vec是训练词向量的一款非常好用的工具,由谷歌发明,主要有:1.2种模型: cbow(连续词袋模型)和skip-gram(跳字模型)2.2种近似训练的方法:层次softmax和naga原创 2021-05-23 18:31:10 · 1535 阅读 · 0 评论 -
NLP自然语言处理1---使用正则表达式
1.析取使用括号,匹配括号里的任意字符[abc]dee],即匹配 adee,bdee,cdee[Ww]ood,即匹配 Wood和wood使用范围:[a-z] 表示匹配小写字母[A-Z] 表示匹配大写字母2.非析取[^Ss][^A-Z]非大写字母,即匹配小写字母或其他字符。3.更多析取more|less,匹配more或者是lessa|b|c,即[a...原创 2019-05-04 14:29:05 · 1229 阅读 · 0 评论 -
使用CNN进行句子分类(Convolutional Neural Networks for Sentence Classification)
Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN。文章地址:https://arxiv.org/pdf/1408.5882.pdf以下是翻译内容摘要:一个简单的CNN需要很少的超参和静态的vector就能够获得很好的结果,如果将静态的vector改为针对任...翻译 2019-07-28 16:43:15 · 1882 阅读 · 0 评论