爬虫笔记
陈小孩
这个作者很懒,什么都没留下…
展开
-
爬虫_chap2数据提取
文章目录爬虫_chap2数据提取XPath语法和lxml模块什么是XPath?XPath开发工具XPath语法选取节点:谓语:通配符选取多个路径:运算符:lxml库:解析器基本使用:从文件中读取html代码:??这个没有??在lxml中使用XPath语法:使用requests和xpath爬取电影天堂爬豆瓣:爬腾讯招聘:chrome相关问题:作业:BeautifulSoup4库安装和文档:几大解析工...原创 2020-02-07 09:18:08 · 1990 阅读 · 0 评论 -
爬虫_chap1网络请求
文章目录爬虫_chap1网络请求01.前奏准备工具:通用/聚焦02.http和https协议:url详解:scheme,host,port,path,query-string,anchor常用的请求方法:get获取, post上传请求头header常见参数:user-angent,referer,cookie常见响应状态码:03.urllib库urlopen函数:得到response,默认请求ge...原创 2020-02-05 17:54:18 · 266 阅读 · 0 评论