获取href 属性值

最新推荐文章于 2023-08-02 15:59:29 发布

scan724

最新推荐文章于 2023-08-02 15:59:29 发布

阅读量1.6k

点赞数

分类专栏： Python 爬虫

本文链接：https://blog.csdn.net/zhaoyangjian724/article/details/103761802

版权

Python 爬虫专栏收录该内容

26 篇文章 33 订阅 ¥39.90 ¥99.00

订阅专栏

# !/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2
import urllib
import cookielib
import json
import httplib
import re
import requests
from lxml import etree
import StringIO
import time
s = requests.session()
print s.headers
url = "http://x.x.26.8:8760/"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:54.0) Gecko/20100101 Firefox/54.0'
}
r = s.get(url, timeout=10, headers=headers)
r=r.text
r=r.encode('utf8')
print type(r)
f=open('fh1.html','w')
f.write(r)
f.close()
fh1=open('fh1.html','r')
fh2=fh1.read()
#print fh2
htmlEmt=etree.HTML(fh2)
#<a href="http://x.x.200.17:7003/loan-web/4ALogon.jsp?tgt=TGT-130672-O1fcAq4HGXFxYjmzfMfuIxAFlqgOfEzNVXja1fDMm5C7IXb7Ox-cas01.example.org" target="_blank">信贷系统</a>
#根据a标签，获取href的值
result=htmlEmt.xpath('//a/@href')
print

了解本专栏

订阅专栏解锁全文

优惠劵

scan724

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
获取href 属性值

# !/usr/bin/env python# -*- coding: utf-8 -*-import urllib2import urllibimport cookielibimport jsonimport httplibimport reimport requestsfrom lxml import etreeimport StringIOimport times ...
复制链接

扫一扫