NLP研究
wangwenping_ok
这个作者很懒,什么都没留下…
展开
-
Python中fast-bert安装
最近在研究我们需要用到的多标签分类,老大说最好是找个封装好的,省时省力的,我暂把之前研究的TextCNN,RNN之类的放一边,看看有没有更省力,效果更好的,别说,还真被我找到一个,fast-bert参考链接:http://blog.sciencenet.cn/home.php?mod=space&uid=377709&do=blog&quickforward=1&id=1180238看了这篇文章,我急于想试试,可是那个Google Colab我访问不了,原谅我不会翻墙,我原创 2020-11-17 10:14:38 · 568 阅读 · 0 评论 -
HanLP学习之路-概念篇
HanLP学习中使用到的一些概念,记录下,学习使用书籍为《自然语言处理入门》-何晗著,书真的很好,真心推荐。机器学习,模型,特征机器学习:让机器学会算法的算法,人们通常指被学习的算法为模型。模型:是对现实问题的抽象,有一个假设函数及一系列参数构成。特征:事物的特点转换成的数值。如牛的特征是4条腿0双翅膀而鸟的特征是2条腿1双翅膀权重:各个特征的重要程度词料库,数据集,训练集,测试集等就像人学习一样,机器学习也需要收集了很多例子来供学习的习题集,这种习题集在机器学习领域叫数据集。在自然语言处理领原创 2020-08-27 14:15:32 · 554 阅读 · 0 评论 -
HanLP研究之二 - 关闭词性及停用词过滤
今天又接着研究Python中HanLP的使用,之前朋友问我你这个HanLP带词性的,能不能把它停用掉,我只需要分词,正好今天看到这边,就记录下。停用词性方法超简单,只需要一段代码:HanLP.Config.ShowTermNature = False词性没有了,但是好多干扰词啊,还有标点符号,都没有用的,看着好乱啊,怎么办?我去百度了下,还真有方法,叫停用词过滤停用词过滤CoreStopWordDictionary = JClass(com.hankcs.hanlp.dictionary.st原创 2020-08-21 16:37:54 · 3131 阅读 · 0 评论 -
HanLP使用第一章Python中安装HanLP组件
** NLP学习 --HanLP**第一次用这个记录下自己的学习进程以免以后忘记了,由于产品设计过程中使用到HanLP,所以自己先研究下,可能研究不会那么深入,今天先来记录自己学习的第一步,使用Python还进行HanLP分词。安装Java下载jdk,下载链接:https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html安装jdk,下载好的jdk直接安装提示安装即可配置环境变...原创 2020-08-21 14:11:42 · 1069 阅读 · 0 评论