python的BeautifulSoup用法



python的BeautifulSoup用法
首先导入模块
from bs4 import BeautifulSoup
soup=BeautifulSoup(opener)

1.tag标签法
soup.head.title
如果是一层层的标签包下去只取每层标签第一个

2.contents法
比如三元素:[u'\n','<html>xxxx</html>',u'\n']
soup.contents   返回列表,不是单一元素
soup.contents[x].contents  是对各列表的取值

3..next法
只对单一元素进行.next,比如
soup.contents[1]=u'HTML'
soup.contents[2]=u'\n'
则soup.content[1].next等价于soup.contents[2]

搜索法
.find('p') 返回字符串
.findall('p') 返回列表

4. .attrs[x]取属性值法
在上述各方法获取标签体之后,通过对标签实施attrs得到一个内部属性列表
在标签后新增.attrs['id']取得该标签内部id的属性值
soup.contents[3].attrs[1]='/'

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值