import csv import lxml import requests import lxml.etree def getInfo(url,headers,fileInfo,i): try: subdata = requests.get(url, headers=headers).content.decode("gbk") mytree = lxml.etree.HTML(subdata) # title=mytree.xpath("/html/body/div[2]/div[2]/div[2]/div/h1/text()")[0] # print(title)
python: 利用requests爬去51job职位信息,并写入CSV
最新推荐文章于 2024-08-01 11:20:11 发布
该博客介绍了如何使用Python的requests库获取51job网站上的职位信息,通过lxml库解析HTML,提取职位详情,并将数据写入CSV文件。主要涉及的步骤包括设置User-Agent,获取网页内容,XPath解析,以及信息写入文本文件。
摘要由CSDN通过智能技术生成