- 博客(16)
- 收藏
- 关注
原创 一学就会使用Python中的requests库进行微博热搜数据的采集与分析(附完整源码)
在这个信息爆炸的时代,社交媒体成为了人们获取新闻和热点信息的重要途径。其中,V博的热搜榜单每天更新,反映了当下社会最关注的话题。通过对这些热搜标题进行分析,我们可以提取出有价值的信息,例如常见词汇和趋势,从而为进一步的数据分析和研究提供依据。解决方案本项目的目标是定期采集微博热搜标题,并对其进行词频统计,以生成词云图,帮助我们可视化这些热搜标题中词汇的使用频率。
2024-09-16 13:47:01 762
原创 3分钟采集评论数据+词云图+情感分析(完整源码下载)
在现代社会,微博作为一种重要的社交媒体平台,承载着大量用户的评论和观点。获取某条微博下的评论信息,在市场调查、舆情监测以及数据分析等领域具有重要价值。然而,手动复制微博评论不仅费时费力,更不容易进行系统化的数据处理。借助Python编写的爬虫程序,可以高效地自动获取这些评论数据,从而提升工作效率。
2024-09-15 16:34:21 404
原创 一分钟绘制LDA主题演化桑基础图
提示:这里对文章进行总结:例如:以上就是今天要分享的内容,本文仅仅简单介绍了利用 Excel 轻松绘制基础的桑基图。如需要一对一讲解,获取博文中的lda主题分析源码均可联系博主!
2024-09-14 23:16:13 530
原创 保姆级教程:0基础在Windows上安装Ffmpeg一分钟下载并安装ffmpeg(附安装包)
例如:项目场景:示例:通过蓝牙芯片(HC-05)与手机 APP 通信,每隔 5s 传输一批传感器数据(不是很大)
2024-09-14 20:52:24 700
原创 快速入门Gephi可视化(2)—词频矩阵 知识单元共现网络图绘制|社科必学软件|文献综述神器
在上期博文中,我们了解了如何利用 LDA 主题模型创建主题关系网络图,探索文本数据中的主题结构。本文将继续探讨数据可视化,在这篇博文中,我们将学习如何使用 Gephi 工具绘制共现矩阵或基于语义的网络共现图,以更好地呈现知识单元之间的关联。
2024-08-30 00:27:26 705
原创 快速入门Gephi可视化!LDA主图关系网络图绘制 | 社科必学软件|文献综述神器
当我们在进行LDA主题分析时,想要把主题和词汇之间的关系以网络图的形式呈现出来时,可以使用一款叫做Gephi的工具来帮助我们画出这个主题关系网络图。这种图形化展示方式可以清晰地显示主题之间的关联,同时展示出主题内部的词汇分布,帮助我们更加直观地理解不同主题之间的联系。先预览结果在进行LDA主题分析时,使用Gephi等工具可将主题与词汇关系可视化为网络图,帮助更好理解主题结构。想在CSDN分享这一过程?记得关注以下步骤:准备数据并导入至Gephi;设计网络图布局和美化效果;
2024-08-28 22:49:58 995
原创 Python虚拟环境venv使用教程
在Python开发中,我们经常会安装其他的依赖包,但当我们用pip移除一个包时,却只移除了指定的包。为了解决这个问题,Python引入了虚拟环境的概念,可以认为是Python环境的多个副本,只是在不同的副本中安装了不同的包。虚拟环境与全局环境不一样:虚拟环境中一般不包含标准库,也不包含Python解释器运行时所需的依赖文件。
2023-12-03 20:46:31 681 1
原创 WARNING: You are using pip version 19.2.3, however version 23.3.1 is available. You should consider
报错记录
2023-12-01 22:47:06 767 1
原创 pycharm中安装第三方库失败
由于python默认的安装源地址是国外的,所以偶尔会遇到安装失败的问题。临时解决方案是,切换为国内安装源。(-i选项,跟的是python安装源地址,这里用到清华大学的安装源)pycharm安装第三方库失败,
2023-09-26 21:18:28 244 1
原创 ModuleNotFoundError代码运行报错
pip install sphinx -i https://pypi.douban.com/simple 安装的库名称。如果安装失败,可能是因为默认的python安装源是国外的。为了临时解决这个问题,你可以尝试切换为国内的安装源。中国科学技术大学:https://pypi.mirrors.ustc.edu.cn/simple/清华大学:https://pypi.tuna.tsinghua.edu.cn/simple。阿里云:http://mirrors.aliyun.com/pypi/simple/
2023-07-08 14:44:40 218 1
原创 Python爬虫技术详解:从入门到精通之 概述
导语:随着互联网的快速发展,爬虫技术在数据获取和应用开发中扮演着重要角色。本文将介绍Python爬虫技术的基本概念、使用场景以及相关工具和技巧,帮助读者从入门到精通。一、什么是爬虫?爬虫是一种自动化获取互联网上数据信息的技术。通过编写程序模拟人的行为,爬虫可以访问指定的网页、提取网页中的数据,并将数据保存或进行进一步的处理和分析。上面是一个简单的爬虫代码,通过简单几行代码就可以获取源代码。
2023-06-27 19:06:56 528
原创 爬虫基本思路流程和代码实现步骤总结之爬取视频
通过发送HTTP请求,获取服务器返回的数据,并使用解析方法提取所需的数据信息,最后将数据保存到本地文件中。video_conten = requests.get(url=video_url,headers=headers).content#获取视频二进制数据。使用requests库的get方法获取音频和视频的二进制数据。解析数据:使用正则表达式或其他解析方法提取所需的数据信息。确定要获取的数据,例如B站视频的标题和URL。保存数据:将解析到的数据保存到本地文件中。re:用于使用正则表达式匹配和提取数据。
2023-06-25 23:43:35 937
原创 实战爬虫电影网的视频
本篇博客主要介绍了如何从电影天堂中爬取电影信息,包括提取到主页面中的每一个电影的背后的那个url地址以及访问子页面,提取到电影的名称以及下载地址。在实际应用中,我们还可以结合其他爬虫技术,如多线程爬虫、分布式爬虫等,来提高爬取效率。作为一个电影迷,我们每天都会关注电影天堂,但是如果想要获取到其中的电影信息,就需要使用爬虫技术。接下来,我们需要使用上面提取到的href值访问子页面,并提取到其中的电影名称和下载地址。首先,我们需要访问电影天堂的主页,并提取到其中的“2023必看热片”部分的HTML代码。
2023-06-25 13:04:41 40
原创 我的Python爬虫学习笔记
Python是一个非常强大的工具,可以方便地实现网络爬虫。我相信在接下来的学习中,我会不断地探索Python网络爬虫的更多奥秘。Python的强大之处在于它有很多优秀的库和框架,可以方便地实现网络爬虫。在学习Python爬虫库的过程中,我发现了一个非常好的网站——CSDN。我开始学习Python网络爬虫的第一步就是学习Python的基础语法。我是一个对于网络爬虫非常感兴趣的人,而Python正好是网络爬虫的一个非常好的工具。我最近开始学习Python网络爬虫,这里记录了我学习的第一篇博客。
2023-06-25 08:13:31 602 2
使用Python中的requests库进行微博热搜数据的采集与分析
2024-09-16
微博评论分析工具:数据采集与情感分析代码
2024-09-15
lda主题模型+wordvec代码+桑基图演化+参考论文
2024-09-14
ffmpeg-2024-09-12-git-504c1ffcd8-full-build
2024-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人