PyQuery介绍及代码

1 概念

pyquery库是jQuery的Python实现,能够以jQuery的语法来操作解析 HTML 文档,易用性和解析速度都很好,和它差不多的还有BeautifulSoup,都是用来解析的。

2 常用方法

在这里插入图片描述
例:查找标签,打印id=container的标签:

print(doc.find('#container'))

3 CSS选择器

在这里插入图片描述

4 代码示例

if __name__ == '__main__':
    #打开文件,读取文本,作为q的内容
    q=PyQuery(open('ev.html').read())
    #示例1:打印title里面的数据
    print q('title').text()
    
    #示例2:选择器.class:div中class=inner,>a表示子节点是a
    for each in q('div.inner>a').items:
        if each.attr.href.find('tab')>0:
            #打印超链接
            print each.attr.href
            
    #示例3:选择器id=tab,>a表示子元素是a
    for each in q('#tab>a').items:
        #打印超链接
        print each.attr.href
        
    #示例4:空格只需要包含在cell中就行,不一定是亲子节点,可以两层三层
    for each in q('.cell a[href^="/go/"]').items:
        #打印超链接
        print each.attr.href

注:print each.attr.href:打印超链接 print each.html():打印文本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值