python获取http网页标题

最新推荐文章于 2024-08-14 15:24:20 发布

<xss_0001234

最新推荐文章于 2024-08-14 15:24:20 发布

阅读量4.3k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/u012804180/article/details/102837944

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

def get_title(url):
    s = requests.session()
    response = request.urlopen(url)
    html = response.read()
    charset = chardet.detect(html)['encoding']  # 对该html进行编码的获取
    result = s.get(url)
    if (charset == "GB2312" or charset is None):
        result.encoding = 'gbk'
    else:
        result.encoding = 'utf-8'
    content = result.text
    title = re.findall('<title>(.*)</title>', content)[0]
    return title