soup.select()使用方法:
- 标签名不加任何修饰,
- 类名(class="className"引号内即为类名)前加点,
- id名(id="idName"引号前即为id名)前加 #,
返回类型是 list
1)通过标签名查找
print soup.select(‘title’)
#[< title>The Dormouse's story< /title>]
(2)通过类名查找
print soup.select(’.sister’)
#[<a class="sister" href="http://example.com/elsie" id="link1"><!-- Elsie --></a>, <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
(3)通过 id 名查找
print soup.select(’#link1’)
#[<a class="sister" href="http://example.com/elsie" id="link1"><!-- Elsie --></a>]