基于
Python
的新浪微博爬虫程序设计与研究
毕志杰
;
李静
【期刊名称】
《信息与电脑》
【年
(
卷
),
期】
2020(032)004
【摘要】
随着大数据时代的到来和数据挖掘技术的发展
,
各类数据都变得愈发重
要
.
在自媒体发展的热潮中
,
新浪微博已成为国内最大的社交媒体之一
.
网民们可
以在微博上以文字、图片、视频等形式发布微博
,
实现信息的即时分享、传播互
动
.
如何获取这些非结构化形式的数据并存储以便后续利用是一个挑战
.
笔者阐述
了新浪微博数据爬取的方式
,
并模拟登录新浪微博、验证码识别、对网页进行解
析、对爬取的数据进行保存和处理
.
【总页数】
3
页
(150-152)
【关键词】
网络爬虫
;
新浪微博
; Python
【作者】
毕志杰
;
李静
【作者单位】
南京森林警察学院
江苏南京
210023
【正文语种】
中文
【中图分类】
TP393.092; TP391.1
【相关文献】
1.
基于
Python
的新浪微博数据爬虫程序设计
[C],
陈琳
;
任芳
2.
基于
Python
的新浪微博数据爬虫程序设计
[J],
陈琳
;
任芳
3.
基于
Python
的新浪微博爬虫分析
[J],
杜晓旭
;
贾小云
4.
基于新浪微博的爬虫程序设计与实现
[J],
胡海潮
5.
基于
Python
的新浪微博用户数据采集与分析
[J],
高雅
;
苏艳
;
席方园