PyQuery库

  1. 初始化
html='<div class="header wrap"><a href="#" class="logo"><img src="images/logo.png" alt=""></a><ul class="nav"><li class="active"><a href="#">官网首页<em>HOME</em></a></li><li><a href="#">全新VIP<em>NEW VIP</em></a></li><li><a href="#">电子代理<em>AGENT</em></a></li><li><a href="#">活动大厅<em>ACTIVITY</em></a></li><li><a href="#">手机APP下载<em>MOBILE</em></a></li><li><a href="#">在线客服<em>SERVICE</em></a></li></ul></div>'
from pyquery import PyQuery as pq
#字符串初始化  doc此时为元素对象
doc = pq(html)
# 使用查找方法与用jquery一样,中间用空格分开,按照一定的层级关系可查找到,id选择器使用# 类选择器使用.
print(doc('li a em'))
#URL初始化 传入url,自动请求连接得到的数据
doc = pq(url='http://www.baidu.com')
# print(doc)
#文件初始化 传入文件目录/文件名
doc = pq(filename='demo.html')
print(doc)
  1. 子元素查找
html='<div class="header wrap"><a href="#" class="logo"><img src="images/logo.png" alt=""></a><ul class="nav"><li class="active"><a href="#">官网首页<em>HOME</em></a></li><li><a href="#">全新VIP<em>NEW VIP</em></a></li><li><a href="#">电子代理<em>AGENT</em></a></li><li><a href="#">活动大厅<em>ACTIVITY</em></a></li><li><a href="#">手机APP下载<em>MOBILE</em></a></li><li><a href="#">在线客服<em>SERVICE</em></a></li></ul></div>'
from pyquery import PyQuery as pq
#字符串初始化  doc此时为元素对象
doc = pq(html)
li = doc('li')
print(type(li)) #打印类型为pyquery类型
print (li)
a = li.find('a') #查找子类型
a = li.children() #查找直接子元素
ul = li.parent() #查找直接父级元素
li = li.siblings() #查找兄弟元素
print (type(a)) #打印类型仍为pyquery类型,可以继续向下层层查找
print (a)
  1. 遍历
# 遍历
lis = a.items()  #用.items方法,生成一个指针器 类型为generator 可用for循环遍历
print (lis)
for li in lis:
    print (li)
  1. 获取信息
   # 获取属性,用attr 可获取里面的跳转连接href 样式名等
   print (li.attr('class'))
   print (li.attr('href'))
   # 获取文本,用text方法
   print (li.text())
   # 获取html ,用html方法
   print (li.html())
  1. DOM操作
#dom操作与jquery操作一样
li.addClass('active')  #添加样式名
li.removeClass('active')  #移除样式名
li.attr('name','link')  #添加属性 name='link' 如果存在name则覆盖
li.css('font-size','14px') #添加样式css
  1. remove 移除某段信息
    # 获取文本,用text方法
    print (li.text())
    # 删除a标签里<em>标签的文字
    li.find('em').remove()
    print (li.text())

7.pyquery 操作api查看手册
https://pyquery.readthedocs.io/en/latest/api.html
8.
9.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值