爬虫学习
Raymone_
这个作者很懒,什么都没留下…
展开
-
爬虫学习:解析库的使用
使用正则表达式提取网页页面信息略显繁琐。对一个网页的节点来说,具有 id 和 class 等属性,并且节点之间还有层次关系,因此我们可以通过 XPath 或 CSS 选择器来提取节点,再获取其正文内容或者属性。本文主要学习 lxml,Beautiful Soup,pyquery 等 3 个解析库原创 2019-08-03 16:41:54 · 420 阅读 · 0 评论 -
爬虫学习:基本库的使用
爬虫学习:基本库的使用1. urllib2. requests3. 正则表达式4. 抓取猫眼电影排行原创 2019-08-01 12:14:42 · 1620 阅读 · 0 评论