TF-IDF算法的代码实现

最新推荐文章于 2024-06-15 19:03:40 发布

KujyouRuri

最新推荐文章于 2024-06-15 19:03:40 发布

阅读量574

点赞数

本文链接：https://blog.csdn.net/KujyouRuri/article/details/118228641

版权

引入依赖import numpy as npimport pandas as pd定义数据和预处理docA = "The cat sat on my bed"docB = "The dog sat on my knees"bowA = docA.split(" ")bowB = docB.split(" ")bowA# 构建词库wordSet = set(bowA).union(set(bowB))wordSetOut[3]:{'The', 'bed', '.

摘要由CSDN通过智能技术生成

引入依赖

import numpy as np
import pandas as pd

定义数据和预处理

docA = "The cat sat on my bed"
docB = "The dog sat on my knees"

bowA = docA.split(" ")
bowB = docB.split(" ")
bowA

# 构建词库
wordSet = set(bowA).union(set(bowB))
wordSet


Out[3]:

{
   'The', 'bed', 'cat', 'dog', 'knees', 'my', 'on', 'sat'}

进行词数统计


# 用统计字典来保存词出现的次数
wordDictA = dict.fromkeys( wordSet, 0 )
wordDictB &#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

KujyouRuri

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
TF-IDF算法的代码实现

引入依赖import numpy as npimport pandas as pd定义数据和预处理docA = "The cat sat on my bed"docB = "The dog sat on my knees"bowA = docA.split(" ")bowB = docB.split(" ")bowA# 构建词库wordSet = set(bowA).union(set(bowB))wordSetOut[3]:{'The', 'bed', '.
复制链接

扫一扫