- 博客(3)
- 收藏
- 关注
原创 Sklearn的Tf-Idf的向量计算
对于TF-IDF的计算,我们都知道是TF与IDF的乘积,但sklearn中计算的结果和我们手动计算的不太一样,究竟是什么原因呢?TF计算为词在文档中出现的频数。IDF为总文档除以词出现在文档中的文档数,再求对数,再加1。即其中,n为总文档数,df(t, d)为出现词t的文档数d。为了防止df(t, f)为0,一般我们会将n和df(t, d)加1,进行平滑。即使用 TF * IDF即得到结果。但是,sklearn中的计算结果却与我们计算得到的不同。from sklearn.f
2020-09-10 09:39:54 605
原创 关于Dict2Anki插件不能导入欧路词典的问题
1.按照下面网址的介绍更改欧路词典处理文件看这里2.新建一个模板新建一个模板,名称为“Dict2Anki-v6.1.3”,后面的版本换成自己的版本。如图所示:3.添加字段包含字段包含如下:['term', 'definition', 'sentenceFront', 'sentenceBack', 'phraseFront', 'phraseBack', 'image', 'BrEPhonetic', 'AmEPhonetic', 'BrEPron', 'AmEPron']其
2020-09-08 17:47:29 2558
原创 使用tar解压gz文件出现 “not in gzip format”错误解决办法
我在解压.gz文件时使用的下面命令:tar -zxvf *.tar.gz然后出现下面的提示:gzip: stdin: not in gzip formattar: Child returned status 1tar: Error is not recoverable: exiting now解决办法:tar -xvf *.tar.gz
2020-09-07 15:12:58 7329
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人