python微博爬虫程序_基于Python的新浪微博爬虫程序设计与研究

本文探讨了在大数据背景下,如何利用Python设计和实现新浪微博爬虫程序。通过模拟登录、验证码识别和网页解析,有效地抓取、存储和处理非结构化的微博数据,为数据挖掘提供可能。
摘要由CSDN通过智能技术生成

基于

Python

的新浪微博爬虫程序设计与研究

毕志杰

;

李静

【期刊名称】

《信息与电脑》

【年

(

),

期】

2020(032)004

【摘要】

随着大数据时代的到来和数据挖掘技术的发展

,

各类数据都变得愈发重

.

在自媒体发展的热潮中

,

新浪微博已成为国内最大的社交媒体之一

.

网民们可

以在微博上以文字、图片、视频等形式发布微博

,

实现信息的即时分享、传播互

.

如何获取这些非结构化形式的数据并存储以便后续利用是一个挑战

.

笔者阐述

了新浪微博数据爬取的方式

,

并模拟登录新浪微博、验证码识别、对网页进行解

析、对爬取的数据进行保存和处理

.

【总页数】

3

(150-152)

【关键词】

网络爬虫

;

新浪微博

; Python

【作者】

毕志杰

;

李静

【作者单位】

南京森林警察学院

江苏南京

210023

【正文语种】

中文

【中图分类】

TP393.092; TP391.1

【相关文献】

1.

基于

Python

的新浪微博数据爬虫程序设计

[C],

陈琳

;

任芳

2.

基于

Python

的新浪微博数据爬虫程序设计

[J],

陈琳

;

任芳

3.

基于

Python

的新浪微博爬虫分析

[J],

杜晓旭

;

贾小云

4.

基于新浪微博的爬虫程序设计与实现

[J],

胡海潮

5.

基于

Python

的新浪微博用户数据采集与分析

[J],

高雅

;

苏艳

;

席方园

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值