NLP
企鹅宝儿
小白成长计划
展开
-
关于如何使用Chinese-Word-Vector工具
关于如何使用Chinese-Word-Vector工具做中文NLP最重要的是中文分词和词嵌入,有一些预训练的词嵌入文件已经写好了,我们只需要加载使用就好因为加载的过程会出现编码的错误,所以直接open的方式读取词嵌入文档是不行的下面介绍三种不同的加载Chinese-Word-Vector方法,拿sgns.zhihu.bigram-char.bz2举例方法一from gensim.models.keyedvectors import KeyedVectorsw2v_model = KeyedV原创 2021-11-28 19:19:31 · 3615 阅读 · 2 评论 -
【NLP】安装nlgeval依赖包
nlgeval 的功能nlgeval 全称是【netural language generation evaluation】主要是用在NLP领域中,用来评估模型的方法包,包括BLEU, ROUGE等常见的评测方法的接口。相关文档请参考nlgeval安装pip install git+https://github.com/Maluuba/nlg-eval.git@master...原创 2021-09-29 13:20:35 · 1539 阅读 · 0 评论 -
黑马NLP实战 --- 新闻分类模型训练
关于《黑马程序员》课程中NLP中 训练新闻分类模型最近在学习NLP的相关知识,找了资料比较全的黑马程序员中讲解NLP的课程,可是其中有一部分实战 新闻主题分类实战项目中,我发现黑马程序员代码有大两的错误,多处代码逻辑错误:首先是数据集下载太慢,因为需要翻墙才能下载,所以大部分情况在加载数据集就会出现Timeout异常数据集的处理,在课程中并没有提到,加载本地的csv数据集文件出现的格式不对的情况其次,generator_banth()这个方法中返回的数据对象元组形式是不对的,新闻数据集的元组是3项原创 2021-03-22 20:54:34 · 1188 阅读 · 6 评论