python BeautifulSoup使用小记

                                              python BeautifulSoup使用小记

    注:最近在使用BeautifulSoup 进行HTML解析,记一笔~

一、BeautifulSoup一些用法规则

1.导入BeautifulSoup模块

from BeautifulSoup import BeautifulSoup

2.获取BeautifulSoup对象

soup=BeautifulSoup(str) 

3.通过ID获取指定对象

soup.find(id='newscontent')  #返回id='newscontent'的第一个可匹配对象
soup.findAll(id='newscontent') #返回id='newscontent'的所有Tag以及NavigableString

4.通过class属性获取指定对象

soup.find(attrs={'class':'pagelink'}) #返回class='pagelink'的第一个可匹配对象

5.通过Tag获取指定对象

soup.find('em')   #<em>one</em>

soup.findAll('em') #获取所有的<em>标签

soup.findAll('em')[0] #获取所有<em>标签中的第一个<em>标签

#获取 与所有<em>标签中的第一个<em>标签并列的下面所有的<dd>标签
soup.findAll('em')[0].findAllNext('dd') 

如果一个标签只有一个子节点且是字符串类型,这个子节点可以这样访问 tag.string,等同于tag.contents[0]的形式

soup.find('em').string      #<em>one</em> ->one

通过get()方法获取tag对应的属性值

soup.find('a').get('href') #<a href='http://cn.bing.com/'> </a> -> 'http://cn.bing.com/'

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值