python完整框架爬取浙江省的职高

import requests
from lxml import etree
wangzhi=‘http://www.zjcs.net.cn/’
url=‘http://www.zjcs.net.cn/index/xwsd.htm’
headers={‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36’}
html=requests.get(url,headers=headers)
html.encoding=‘utf-8’

print(html.text)

html=etree.HTML(html.text)

title=html.xpath(’/html/body/div[3]/div[2]/ul/li[1]/p/a/@href’)[0]

print(title)

url=title.replace(’…/’,wangzhi)

print(url)

for i in range(1,11):
sd=162-i
jixupa=‘http://www.zjcs.net.cn/index/xwsd/’+str(sd)+’.htm’
# print(jixupa)
html = requests.get(jixupa, headers=headers)
html.encoding = ‘utf-8’
# print(html.text)
html = etree.HTML(html.text)
title = html.xpath(’//*[@id=“line_u6_0”]/p/a/@href’)[0]
url=title.replace(’…/…/’,wangzhi)
# print(html.text)
print(url)
html = requests.get(url, headers=headers)
html.encoding = ‘utf-8’
print(html.text)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值