自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 关于命名实体识别的方法对比总结与原理初探

主要作用 优点 缺点 BERT BILSTM BIGRU BERT中demo:如图两个句子的分类任务(MNLI\QQP\QNLI\STS-B\MRPC\RTE\SWAG),单句的分类任务(SST-2\CoLA);问答任务(SQuAD v1.1);单句序列标注任务(CoNLL-2003 NER)一、BERT 原理初探原文下载地址:https://arxiv.org...

2020-11-07 15:39:03 1725

原创 NLP中花里胡哨的名词

词嵌入与词向量:词向量还挺好理解的,就是将一个词用一组数字完成的向量来表示,至于咋表示,那方法就很多了,就比如独热、tfidf之类的。那他又为啥会跟词嵌入扯上关系呢?害,先来解释啥叫嵌入。经过一番的搜索,理解成嵌入通常是指将一个高维的向量映射到低维向量中去。因为这么着能够减少计算过程中的空间消耗,提高效率,所以呀,人们就经常这么干。那么这个词嵌入是啥呢,就是说你从高维词向量转换为低维词向量的这个过程,就叫做词嵌入。至于咋转换的,以后再说吧。(我琢磨着,嵌入这个词放到别的地方应该也可以这么理解。比如啥知识

2020-10-28 17:18:53 195

原创 LDA主题模型

近期做了一个关于主题分析的重新学习,感觉只看不实操真的就和白学了一样。也趁着这股劲把关于LDA主题模型的东西总结一下,这些是目前我能够考虑到的所有事情,以后看到再做补充(新手小白请指正我的错误,十分感谢!!)。总结学习使我进步!!一、整体脉络二、原理解析LDA也称为隐狄利克雷分布,LDA的目的就是要识别主题,即把文档—词汇矩阵变成文档—主题矩阵(分布)和主题—词汇矩阵(分布)。 地址: https://www.cnblogs.com/pinar...

2020-10-14 14:01:27 3535 2

原创 Python 词云

Python 词云#matplotlib #wordcloud #NLP在进行词云展示之前需要对文本数据进行分词处理,处理为一定格式的词的汇总的形式,常用到的工具有jieba,nltk等。from wordcloud import WordCloudfrom wordcloud import *import matplotlib.pyplot as pltimport matplotlib.image as mpimgcolor_mask = mpimg.imread("./..

2020-10-09 18:59:24 444 1

原创 Spyder初学

输入参数参数的易错点:1)Spyder中参数默认包围格式是用单引号(args=‘略略略’,如下图所示),所以传入多个参数时 参数值需用双引号包围,以防出错。2)每个参数前要加“-”或者“-- ”,参数赋值中要用等号“=”,每个参数后加空格3)当连续两次更改参数设置时,会报错;需要重启Console,重新修改参数格式后再次运行(在Console中右键点击Quit后,稍等片刻)来自:https://blog.csdn.net/lijr20000222/article/details/10732908..

2020-10-08 10:25:36 608

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除