python:TF-IDF和词袋模型转换文本数据代码实现

最新推荐文章于 2024-05-12 19:03:25 发布

吴小波呀

最新推荐文章于 2024-05-12 19:03:25 发布

阅读量265

点赞数 1

文章标签： python tf-idf 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50545382/article/details/136274557

版权

一、词袋模型转换文本数据

from sklearn.feature_extraction.text import CountVectorizer

# 实例化模型
count_vectorizer = CountVectorizer(stop_words='english')

# 转换文本数据
sparse_matrix = count_vectorizer.fit_transform(text)

# 获取转换结果
doc_term_matrix = sparse_matrix.todense()

# 输出结果
doc_term_matrix

二、TF-IDF 转换文本数据

from sklearn.feature_extraction.text import TfidfVectorizer

# 实例化TF-IDF法
tfidf_vectorizer = TfidfVectorizer()

# 将语料集转化为TF-IDF向量
tfidf_matrix = tfidf_vectorizer.fit_transform(text)

# 显示结果
tfidf_matrix.toarray()

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python:TF-IDF和词袋模型转换文本数据代码实现

【代码】python:TF-IDF和词袋模型转换文本数据代码实现。
复制链接

扫一扫

吴小波呀 CSDN认证博客专家 CSDN认证企业博客

码龄4年

8: 原创

151万+: 周排名

17万+: 总排名

2469: 访问

: 等级

108: 积分

20: 粉丝

28: 获赞

4: 评论

18: 收藏

私信

关注

热门文章

最新评论

python：机器学习特征选择之包裹法代码实现
CSDN-Ada助手: 恭喜您写了第6篇博客！看到您分享了关于机器学习特征选择之包裹法的代码实现，非常有收获。希望您能继续保持创作的热情和耐心，探索更多有趣的主题。下一步，或许可以考虑分享一些实战经验或者案例分析，让读者更加直观地理解和应用您所分享的知识。期待您的下一篇作品！
python：机器学习特征选择之过滤法代码实现
CSDN-Ada助手: 恭喜作者发布了新的博客，分享了关于机器学习特征选择之过滤法的代码实现。希望作者能够继续保持创作的热情和努力，为读者提供更多有价值的内容。在下一篇博客中，或许可以探讨一些不同的特征选择方法，或者深入分析特征选择在机器学习中的重要性。期待作者的进一步探索和分享！愿您的创作之路越走越宽广，不断进步！
python：机器学习特征选择之嵌入法代码实现
CSDN-Ada助手: 恭喜您发布了新的博客！看到您分享了关于Python机器学习特征选择嵌入法的代码实现，内容非常有价值。希望您能继续保持创作的热情，也可以考虑分享一些实际案例或者应用场景，让读者更好地理解和应用这些技术。期待您下一篇博客的发布！祝您创作顺利！
python：散点图基础绘制，matplotlib和seabron
CSDN-Ada助手: 恭喜您写了第四篇博客！学习了如何用Python绘制散点图，对数据可视化有了更深入的了解。接下来，也许可以考虑写一些实际案例，结合散点图的绘制，展示数据分析的应用场景，让读者更直观地感受到散点图的魅力。希望您能继续坚持创作，期待您更多精彩的内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。