BS4使用方法

导入模块

from bs4 import  BeautifulSoup
import bs4

创建soup对象(读取file文件创建)

filepath = 'test.html'
soup = BeautifulSoup(open(filepath,encoding='utf-8'),'lxml')

使用

根据标签查找(type:bs4_obj)

tag_p = soup.p

获取属性

name = tag_p.name
title = tag_p.attrs.get('title')
title = tag_p.get('title')
title = tag_p['title']

获取文本内容

string = tag_p.string
text = tag_p.get_text()
content = tag_p.contents

#过滤注释内容
if type(tag_p.string)==bs4.element.Comment:
    print('这是注释内容')
else:
    print('这不是注释')

获取子孙节点(tpye:generator)

descendants = soup.p.descendants

find&&find_all查找

soup.find('a')
soup.find('a',title='hhh')
soup.find('a',id='')
soup.find('a',class_='')

soup.find_all('a')
soup.find_all(['a','p'])
soup.find_all('a',limit=2)

select选择(type:list)

soup.select('.main > ul > li > a')[0].string
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值