python之简历或者简历模板的爬取
本案列采用的是:xpath爬取
## 爬取的是某网站素材的前5页,提示尽量不要爬太多。本案例是最原始的代码,没有涉及多线程。(感谢站长素材)
代码:
import requests
from lxml import etree
import os
#创建目录
dirName='简历封面01'
if not os.path.exists(dirName):
os.mkdir(dirName)
count=1
#UA机制
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'
}
#打开文件
url='http://sc.chinaz.com/jianli/fengmian_{}.html'
#爬取1-5页
for page in range(1,6)