![662bed3c7d40dcfb91e93b1e194885bb.gif](https://i-blog.csdnimg.cn/blog_migrate/486840a855ef591d897eba6072d41d62.gif)
爬取拉勾网python招聘职位
![662bed3c7d40dcfb91e93b1e194885bb.gif](https://i-blog.csdnimg.cn/blog_migrate/486840a855ef591d897eba6072d41d62.gif)
17/10
周四 晴
整体思路:
1 使用我们最近讲的selenium模块进行模拟浏览器爬取
2 网页解析使用 xpath(底层为c语言,效率高)
3保存为csv数据
需要的模块:
import randomimport timeimport csvfrom urllib.parse import quote from lxml import etreefrom selenium import webdriver
其中 selenium 和 lxml 需要 pip install 命令进行安装
class LaGoSpider(object):'''封装为一个类,方便操作''' def __init__(se