![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 88
大数据老张
一个热爱编程的双非科班混子
展开
-
parsel库入门使用实战
parsel库入门使用实战目的网页分析导入需要使用到的模块封装请求头信息,请求url地址初始化parsel对象获取到所有的table标签从table标签中提取出书籍各项信息数据爬取结果完整代码目的爬取豆瓣读书Top250页面爬取第一页的25本书的书名,作者,出版社,出版日期,价格,评分,简介,详情链接url地址:https://book.douban.com/top250使用parsel.css得到的结果是一个特殊对象,这个对象可以再次使用css()方法网页分析首先打开url地址,查原创 2020-06-28 19:09:00 · 4353 阅读 · 1 评论 -
数据解析神器 parsel库
parsel库的基本使用parsel是一个python的第三方库,相当于css选择器+xpath+re。parsel由scrapy团队开发,是将scrapy中的parsel独立抽取出来的,可以轻松解析html,xml内容,获取需要的数据。相比于BeautifulSoup,xpath,parsel效率更高,使用更简单。安装pip install parsel直接pip安装下载速度可能比较慢,推荐使用豆瓣源pip install parsel -i http://pypi.douban.com/原创 2020-06-25 21:36:17 · 21991 阅读 · 3 评论