![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
nlp
文章平均质量分 57
JECK_ケーキ
这个作者很懒,什么都没留下…
展开
-
python计算tfidf sklearn计算
利用python 计算文档的tfidf,步骤大概如下: 读入文档,对文档进行分词,每一段为一个字符串,分词用空格隔开,读入文档是一个长度为该文档段数的列表。 利用vectorizer生成词频矩阵X , 再利用tfidftransformer 生成tfidf矩阵。 代码如下: import jieba import numpy as np from sklearn import feature_extraction from sklearn.feature_extraction.text impor原创 2020-12-23 09:41:22 · 1139 阅读 · 0 评论 -
python制作词云图
之前一直做词云图,没有总结,今天重新做了一遍,代码放上,免得以后找不到。 import pandas as pd import numpy as np import re import matplotlib.pyplot as plt from wordcloud import WordCloud import os import jieba from collections import Counter #必须指定字符位置,否则乱码 fontpath = 'C:\\Windows\\Fonts\\sim原创 2020-12-15 09:09:13 · 365 阅读 · 1 评论