![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
尼克张
多思考,多动手
展开
-
Python爬虫实例:使用requests库和re库爬取某旧书网
在简单学习和了requests库和正则表达式re库后,尝试使用这两个第三方库完成爬取某旧书网书名价格并打印。但是最终打印结果出现了部分乱序,猜测是正则表达式形式问题。进而在后面学习中,我就感受到了BeautifulSoup库这种解析库和HTMl类的标签语言的好用。 import requests import re #爬取网页数据并解码得到文本 def getHTML(url): tr...原创 2019-04-11 14:00:34 · 739 阅读 · 0 评论 -
Python爬虫实例:爬取微信公众号图片(表情包)
在学习了requests库之后,就能够很轻松地爬取静态页面的信息,把网页对象获取到本地。但是此时如何把复杂的网页信息解析出来,便需要使用到正则表达式或者这次分享的BeautifulSoup库。BeautifulSoup是非常好用的第三方解析器,具体介绍和使用参考官方说明文档 以下是我使用Re库、Requests库和BeautifulSoup库编写的爬取公众号图片(表情包)程序,分享源码: impo...原创 2019-04-12 13:59:05 · 5631 阅读 · 4 评论