Python简单爬虫
「已注销」
这个作者很懒,什么都没留下…
展开
-
PythonRun
urllib2库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urllib2。 urllib2 是 Python2.7 自带的模块(不需要下载,导入即可使用) urllib2 官方文档:https://docs.python.org/2/library/urllib2.html urllib2 源码:...原创 2019-06-15 13:51:25 · 926 阅读 · 0 评论 -
xiecheng_spider
xiecheng_spider携程民宿爬虫 获取URL 由于携程网页由CSS编写,因此我们需要使用浏览器去跳转页面,这里我需要做一些准备工作 1.安装谷歌浏览器驱动,连接如下。安装成功后要放在PATH路径下 http://npm.taobao.org/mirrors/chromedriver/ 2.安装环境,这里我用的Python3.7 # 我们需要使用其中的模块 pip install s...原创 2019-06-16 20:43:14 · 254 阅读 · 0 评论