自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 问答 (2)
  • 收藏
  • 关注

原创 【重磅】NLP实战之BERTopic主题模型分析(pycharm版)

之前写了一篇NLP实战之BERTopic主题模型分析,由于没有说明是在jupyter notebook中的运行的,所以很多小伙伴去pycharm中运行,没有结果也没有可视化的图片。这篇博客将完美解决!

2024-03-22 20:30:36 6214 22

原创 BERTopic详细安装教程

首先说明一下博主的conda版本为4.9.2,运行的环境是jupter notebook,博主建议在conda环境下安装,非常方便,conda安装教程非常多,大家很容易就能找到,这里我就不再赘述了。安装完成bertopic以后,在notebook中跑一下代码试试看(pycharm中运行无报错,但无法出现可视化的图,博主也在想办法解决)。有了conda环境以后,咱们直接在cmd中输入命令,搭建一个名为zhuti的虚拟环境,并设置python的版本为3.8。参考这篇博客的第三种方法!参考这篇博客的第三种方法!

2024-03-17 11:00:21 2100 9

原创 网络爬虫基础案例实战

h2节点的外面包含一个a节点,这个节点带有href属性,其实就是一个超链接,href的值为/detail/1,这是一个相对于网站的根URL hhtps://ss1.scrape.center/的路径,加上网站的根URL就构成了电影详情页的URL,即hhtps://ss1.scrape.center/detail/1。接下来分析一下翻页的逻辑,当点击最下方的第2页时,可以看到网页的URL变成了hhtps://ssr1.scrape.center/page/2,以此类推,第3页,第4页等等。

2024-03-15 23:22:35 1253 1

原创 解决Sentence Transformers中all-minilm-l6-v2等模型下载问题

今天和大家分享一下如何解决Sentence Transformers中all-minilm-l6-v2等模型下载及使用时,报错:SSLError: HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /api/models/sentence-transformers/all-MiniLM-L6-v2...问题。

2023-10-24 20:17:14 6393 6

原创 NLP实战之BERTopic主题分析

BERTopic是一种结合了预训练模型BERT和主题建模的强大工具。它允许我们将大规模文本数据集中的文档映射到主题空间,并自动识别潜在的主题。它背后的核心思想是通过BERT模型来捕获文档的语义信息,并然后使用主题建模技术来对这些语义信息进行聚类,从而得出主题。对于大部分小伙伴而言,知道如何去使用BERTopic模型进行主题分析就足够了。所以BERTopic原理就不做过多解释了,感兴趣的小伙伴可以自己去了解一下。BERTopic是一种强大的主题分析工具,它能够自动识别文本数据中的主题,而无需预先定义主题数。

2023-10-21 16:52:20 14033 81

原创 解决用pyLDAvis做可视化的时候报错:TerminatedWorkerError: A worker process managed by the executor was...

之前一直都是在jupyter上面运行的,今天换到pycharm上运行,报错更加清晰joblib.externals.loky.process_executor.TerminatedWorkerError,去网上查了一下是因为joblib包版本过高(我的joblib版本是1.3.2),降低一下版本就行了。

2023-10-11 20:08:14 2187 11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除