python中解析html中的meta(title,description,keywords)信息

html中的meta信息往往包含title,description,keywords,下面通过BeautifulSoup来解析meta信息

from bs4 import BeautifulSoup
from selenium import webdriver


def main():
    driver = webdriver.Chrome()
    driver.get('https://36kr.com/')
    html = driver.page_source
    soup = BeautifulSoup(html)
    title=soup.title.string
    description = soup.find(attrs={"name": "description"})['content']
    keywords = soup.find(attrs={"name": "keywords"})['content']
    print('title:', title)
    print('description:', description)
    print('keywords:', keywords)



if __name__ == '__main__':
    main()

见证结果的时候

title: 首页_36氪
description: 36氪为您提供创业资讯、科技新闻、投融资对接、股权投资、极速融资等创业服务,致力成为创业者可以依赖的创业服务平台,为创业者提供最好的产品和服务。
keywords: 创业,互联网创业,互联网创业项目

tips: 并不是所有的网站都可以解析到meta信息的

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值