- 博客(16)
- 收藏
- 关注
原创 TF-IDF、TextRank
对student.txt文件中的文字进行关键词提取,提取出的关键词无停用词.txt文件里的词,比较TF-IDF和TextRank算法的结果。
2024-04-15 09:45:56 97 1
原创 生成词云之python中WordCloud包的用法(转发版)
https://baijiahao.baidu.com/s?id=1787390366233307443&wfr=spider&for=pc
2024-04-15 09:35:58 79 2
原创 打字后面的字消失,可能是这三种原因,解决方法都在这里了(转发版)
https://baijiahao.baidu.com/s?id=1787390366233307443&wfr=spider&for=pc
2024-04-15 09:18:41 113 1
原创 文档相似度
①如果两个文档/两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似度程度。②文档向量化之后,相似度的考察就可以直接转化为计算空间中距离的问题。为了避免文章长度的差异,长度悬殊时可以考虑使用相对词频。③缺陷:不能考虑否定词的巨大作用,不能考虑词序的差异。计算两个向量的余弦相似度,值越大就表示越相似。使用TF-IDF算法,找出两篇文档的关键词。③点评网站/微博微信平台上的类似内容推荐。①搜索引擎的类似文章推荐。②购物网站的类似商品推荐。将语料转换为词频向量。
2024-04-15 09:04:05 194 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人