BeautifulSoup_CSS_Select 用法和实例

Usage_BeautifulSoup_CSS_Select

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Date    : 2017-09-24 18:50:21
# @Author  : kangvcar (kangvcar@126.com)
# @Link    : http://www.github.com/kangvcar/
# @Version : $Id$

from bs4 import BeautifulSoup

html = """
The Dormouse's story

The Dormouse's story

Once upon a time there were three little sisters; and their names were , Lacie and Tillie; and they lived at the bottom of a well.

...

""" soup = BeautifulSoup(html, "lxml") ######################## ###select()返回list#### ######################## ## 我们在写 CSS 时,标签名不加任何修饰,类名前加点,id名前加 #, ## 在这里我们也可以利用类似的方法来筛选元素,用到的方法是 soup.select(),返回类型是 list ## 1.通过标签名查找 # print soup.select('title') # print soup.select('a') # print soup.select('b') ## 2.通过类名查找 # print soup.select('.sister') ## 3.通过 id 名查找 # print soup.select('#link1') ## 4.组合查找 # 查找 p 标签中,id 等于 link1的内容,二者需要用空格分开 # print soup.select('p #link1') # print soup.select('head #link1') # 直接子标签查找 # print soup.select('head > title') ## 5.属性查找 # 查找时还可以加入属性元素,属性需要用中括号括起来 # print soup.select('a[class="sister"]') # print soup.select('a[href="http://example.com/elsie"]') # print soup.select('p a[href="http://example.com/elsie"]') ## 6.使用get_text()方法获取内容 # print type(soup.select('title')) # print soup.select('title')[0].get_text()

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值