import urllib2 import urllib import re print 'begin--' url = 'http://hr.tencent.com/position.php?lid=2175&tid=87' user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64)' headers = { 'User-Agent' : user_agent } param = {} param['lid']=2175 param['tid']=87
python抓取招聘信息简单代码
最新推荐文章于 2022-09-19 14:36:23 发布
本文展示了如何使用Python的urllib2和re库抓取并解析腾讯招聘页面的表格数据,将内容写入文件。首先设置User-Agent,然后构造请求URL,通过Request发送请求,获取响应并读取页面内容,再用正则表达式提取表格数据,并逐条保存到文件中。
摘要由CSDN通过智能技术生成