目的:输入要爬取的职位名称,五个意向城市,爬取智联招聘上的该信息,并打印进表格中
#coding:utf-8 import urllib2 import re import xlwt class ZLZP(object): def __init__(self,workname,citys): # 记录查找工作名称 self.workname = workname # 基础URL地址 self.url = 'http://sou.zhaopin.com/jobs/searchresult.ashx?' # 工作名称 args = 'kw=%s&jl='%workname # 工作地点 for city in citys: # 判断城市是否为最后一个 if city == citys[-1]: args += city else: args += city args += '%2B' # kw=python&jl=北京%2B上海%2B南京%2B广州%2B深圳 # 拼接完整的url地址 self.url += args self.headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0' } # 根据页码获取某一页HTML源代码 def get_page(