python糗事百科爬虫

周末没啥事花了几个钟写了这个爬虫。下面是结构图

这里写图片描述

里面的功能已经足以帮我很好的分析糗事百科这个网站了。当然我知道别人也写过糗事百科的爬虫,不得不承认糗事百科的网页架构很简单,很适合作为爬虫初学者去练手。我是在没有任何参考的情况下一点点摸索写完这个爬虫的,也许比不上资深程序员写的,但也学到了很多

废话少说,下面我就举几个例子来感受下我写的爬虫吧。

1.分析用户

用户主页:
这里写图片描述

代码:

qiushi = QiuShi()
_user_url = 'https://www.qiushibaike.com/users/10074783/'
_user_message = qiushi.analyse_user_from_url(_user_url)
for item in _user_message.items():
    print(item)

分析结果
这里写图片描述

2.分析文章

文章页面:
这里写图片描述

代码:

qiushi = QiuShi()
_article_url = 'https://www.qiushibaike.com/article/119762872'
_article_message = qiushi.analyse_article_from_url(_article_url)
for item in _article_message.items():
    print(item)

分析结果:
这里写图片描述

3.还可以分析并下载用户的所有文章

代码:

qiushi = QiuShi()
_user_url = 'https://www.qiushibaike.com/users/10074783/'
_user_message = qiushi.analyse_user_from_url(_user_url)
_user_name = _user_message['用户名']
_article_urls = _user_message['所有糗事链接']
qiushi.download_article(_article_urls, _user_name)

效果:
这里写图片描述

4.当然除了上面的例子还可以利用我里面的函数自由组合,达到自己想要爬取的结果

最后如果想要源代码的,请关注我的微信公众号,并回复“糗事百科爬虫”便可获取代码:
这里写图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值