![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
文章平均质量分 70
acmakb
火车是向前开的.
展开
-
文本可视化之词云图的使用
读取图像并转换为数组# 创建词云对象,并设置 mask 参数# 生成词云图# 显示词云图plt.show() 通过本文的介绍,我们深入了解了词云图的使用和相关参数,并学会了生成中文词云图、英文词云图以及自定义词云图的样式。词云图作为一种强大的数据可视化工具,可以帮助我们直观地了解文本数据的关键词和主题。无论是从事数据分析、文本挖掘还是对话题进行可视化呈现,词云图都能提供有价值的信息。 在创建词云图时,我们可以根据需求调整不同的参数,如背景颜色、词数限制和停用词等,以达到最佳效果。原创 2024-01-08 16:04:06 · 1409 阅读 · 1 评论 -
提升中文文本分析的效率:掌握jieba分词的技巧
在本博客中,我们深入探讨了jieba分词作为一种强大的中文文本处理工具的各个方面。首先,我们学习了如何使用jieba进行句子拆分,将长文本划分为有意义的句子。接下来,我们了解了关键词提取的重要性,并使用jieba.analyse模块提取出关键词。然后,我们介绍了jieba.posseg模块,通过词性标注来理解每个词语的语法角色。最后,我们讨论了停用词的处理,不仅包括中文停用词,还包括英文停用词。通过去除这些常见的无意义词语,我们能够提高文本分析的准确性和效率。原创 2024-01-08 10:55:19 · 759 阅读 · 1 评论