Beautifulsoup常见用法

import re

from bs4 import BeautifulSoup
html="""
"""
soup=BeautifulSoup(html,'lxml')
print(soup.title)
print(type(soup.title))
print(soup.title.string)
print(soup.head)
print(soup.p) #只会选择第一个匹配的节点
print(soup.title.name)#获取节点名称
print(soup.p.attrs) #获取属性
print(soup.p.attrs['name']) #print(soup.p['name'])亦可
print(soup.p.string)#获取内容
print(soup.p.contents)#获取直接子节点
print(soup.p.children)#获取子节点
print(soup.p.descendants)#获取所有子孙节点
print(soup.p.parent)#获取直接父节点
print(list(enumerate(soup.a.parents)))#获取所有祖先节点
#兄弟节点
print(soup.a.next_sibling)
print(soup.a.previous_sibling)
#所有兄弟节点
print(list(enumerate(soup.a.next_siblings)))
print(list(enumerate(soup.a.previous_siblings)))
#find_all
#print(soup.find_all(name=,attrs=,recursive=,text=,**kwargs=))
#name匹配节点名称,attrs属性,text匹配文本,可以是字符串,也可以是正则表达式对象
print(soup.find_all(name='ul'))
print(soup.find_all(attrs={'id':'list-1'}))
print(soup.find_all(text=re.compile('link')))



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值