python爬取微博用户正文_基于Python的新浪微博用户信息爬取与分析

本文构建了一个使用Python的微博用户信息爬取系统,通过模拟登录获取数据,并以'央视综艺国家宝藏'为案例,分析了微博发布行为、信息特征和关键词,为用户画像提供基础。
摘要由CSDN通过智能技术生成

基于

Python

的新浪微博用户信息爬取与分析

邓文萍

【摘

要】

摘要:本文设计并实现了一个微博用户信息爬取与分析系统

,

利用

Cookie

实现了用户的模拟登录

,

使用

Python

语言的

Rquests

lxml

等函数库

,

爬取、处理了该微博用户数据

,

并以“央视综艺国家宝藏”为例

,

从微博发布动作

偏好、微博信息特征、微博关键词等方面展开了分析

,

获取了一些有趣的发现

,

进一步用户分析与画像打下基础。

【期刊名称】

数字技术与应用

【年

(

),

期】

2019(037)007

【总页数】

3

【关键词】

新浪微博;爬取分析;

Python

0

引言

新浪微博是目前我国最大的短消息社交平台

,

据新浪微博

2017

年全年财报称

,

2017

12

,

微博月活跃用户增至

3.92

亿。社交用户的增多

,

意味着信息的

极具爆炸

,

基于微博数据的社交用户行为分析与画像引起了人们的关注

[1]

。该技

术能够对用户进行画像

,

用于社交群体发现

[2]

、个性用户发现

[3]

等。

本文使用

Python

语言

,

通过模拟用户登录

,

实现一种针对新浪微博的爬虫

,

并对获

得的数据进行有效地分析。该文设计并实现了新浪微博爬虫程序

,

以微博用户

“央视综艺国家宝藏”为例

,

对他发布的微博内容进行了全部抓取

,

并从微博发布

行为、微博信息特征、微博关键词等方面

,

进行了数据分析

,

为用户分析与画像打

下基础。

1

爬虫系统设计

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值