NLP
文章平均质量分 91
Yae Yang
Python爬虫、NLP,html小学生
展开
-
GloVe (python)安装踩坑及使用
在安装glove_python的时候持续的报错:这个问题在我之前安装annoy的时候也出现过,是因为c++编译环境的问题。但我已经有Visual Studio的C++环境了,按道理不该出现这个问题了。仔细看了这一长串报错信息后,发现最根源的问题是这个:这个的意思似乎是cl的环境没有配置,于是参考下面大佬的教程进行了配置。Windows11下配置Visual Studio2022 环境变量(Windows下配置Visual Studio 通用)_vs2022环境变量配置-CSDN博客。原创 2024-06-20 17:42:31 · 822 阅读 · 0 评论 -
pyhanlp vs. hanlp
想要找SDP的hanlp用法,死活找不到,花了很多时间。回归github之后发现实际上hanlp有两个版本,一个1.x,一个2.x。而我目前使用成功的都是1.x的命令,是基于JAVA的。而2.x版本是升级版,有一些功能并没有更新到1.x里,所以无法运行,其中就包括SEP。为什么会产生这种混淆呢?因为网上有很多教程,要么是1.x出来的时候写的,要么是无脑搬运的旧版本的,当时的安装应该也确实是hanlp(也就是说1.x以前的名字和2.x是相同的),导致网络教程和github版本有一些差错,对应不上。那么说一下两原创 2024-05-20 10:54:40 · 619 阅读 · 0 评论 -
gensim TFIFD 模型补充——关于normalize参数
输出整个corpus的tfidf值(注:不能得到每个文档的词语tfidf)设置normalize=False,还是按照tf和id进行查询,详见我之前的博文。原创 2023-11-02 20:40:36 · 171 阅读 · 1 评论