python 单元4 BeautifulSoup库入门

本文介绍了BeautifulSoup库的使用,包括不同解析器的选择(如lxml和html5lib),并详细讲解了其基本元素如Tag、Name、属性、NavigableString和Comment的结构和用法。
摘要由CSDN通过智能技术生成

BeautifuiSoup库的基本元素

BeautifuiSoup库的引用

from bs4 import BeaufifulSoup

BeautifuiSoup库解析器

解析器:bs4的HTML解析器 使用方法:BeautifulSoup(mk,'html.parser') BeautifulSoup 条件:安装bs库

解析器:lxml的HTML解析器 使用方法::BeautifulSoup(mk,'lxml')BeautifulSoup 条件:pip install lxml

解析器:lxml的XML解析器 使用方法::BeautifulSoup(mk,'lxml') BeautifulSoup 条件:pip install lxml

解析器:html5lib的解析器 使用方法::BeautifulSoup(mk,'html5lib')BeautifulSoup 条件:pip install html5lib

BeautifulSoup类的基本元素

基本元素

说明

Tag

标签 ,最基本的信息组织单元,分明用<>和标明开头和结尾

Name

标签的名字,

...

的名字是'p',格式:.name

Attrinutes

标签的属性,字典形式组织,格式:.string

NavigableString

标签内非属性字符串,<>...中的字符串,格式:.string

Comment

标签内字符串的注释部分,一种特殊的Comment类型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值