利用Python爬一下赵丽颖的新浪微博内容和评论

本文介绍了一个Python爬虫,用于抓取赵丽颖的新浪微博内容和部分评论,展示了爬取到的数据,包括关注数、粉丝数、微博等级及内容。由于避免对网站压力,仅爬取了6条微博的20条评论,并制作了词云图。
摘要由CSDN通过智能技术生成

最近赵丽颖离婚时间闹得是沸沸扬扬啊,正好写了一个爬微博内容和评论的爬虫,很多功能后续还会完善,今天先上个尝鲜版,我们先看看爬虫的运行效果,上图:

可以看到我们已经读取到了赵丽颖微博的关注人数,粉丝数量,微博等级,微博主页链接,当然最重要的是微博内容和各大网友的吃瓜评论了,继续上图看看。

当然为了不给微博网站带来太多了压力,这里只爬取6条微博各20条评论,效果展示出来了就行了,爬完了内容和评论当然少不了内容展示的词云图,看效果

 

完整代码如下:

# -*- coding: utf-8 -*-
# author:zhangzesheng
# 导入爬虫库
# -*- coding: utf-8 -*-

import urllib.request
import json,re

#定义要爬取的微博大V的微博ID
id='1259110474'

#设置代理IP
proxy_addr="122.241.72.191:808"

#定义页面打开函数
def use_proxy(url,proxy_addr):
    req=urllib.request.Request(url)
    req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0")
    proxy=urllib.request.ProxyHandler({'http':proxy_addr})
    opener=urllib.request.build_op
  • 6
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 11
    评论
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

淡若扶风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值