python3 ---- PyQuery

最新推荐文章于 2022-05-30 14:49:18 发布

--夏天--

最新推荐文章于 2022-05-30 14:49:18 发布

阅读量322

点赞数

本文链接：https://blog.csdn.net/qq_42336542/article/details/80697540

版权

 
  # pyquery：仿照jquery语法，封装的一个包，和bs4有点类似。 
 
  from pyquery 
  import PyQuery 
 
   html = 
  """ 
 
   <div id='content'> 
 
   <ul class='list'> 
 
   <li class='one'>One</li> 
 
   <li class='two'>Two</li> 
 
   <li class='three'>Three</li> 
 
   <li class='four'>Four</li> 
 
   <div id='inner'> 
 
   <a href='http://www.baidu.com'>百度一下</a> 
 
   <p>第一段</p> 
 
   <p>第2段</p> 
 
   <p>第3段</p> 
 
   <p> 
 
   第4段 
 
   <span>法大师傅大师傅</span> 
 
   </p> 
 
   <p>第5段</p> 
 
   <p>第6段</p> 
 
   </div> 
 
   </ul> 
 
   </div> 
 
  """ 
 
  # 利用PyQuery类，对Html这个文档进行序列化，结果是一个文档对象 
 
   doc_obj = PyQuery(html) 
 
  # print(doc_obj) 
 
  # 查找元素的方法： 
 
   ul = doc_obj( 
  '.list') 
  # 从doc_obj这个对象中根据类名匹配元素 
 
  # print(ul) # ul是一个对象 
 
  # print(type(ul)) 
 
  # 从ul中查找a 
 
  # print(ul('a')) 
 
  # 当前元素对象.find(): 在当前对象中查找后代元素 
 
  # 当前元素对象.chrildren(): 在当前对象中查找直接子元素 
 
  # print(ul.find('a')) 
 
  # 父元素查找 
 
  # parent(): 直接父元素 
 
  # parents(): 所有的父元素 
 
   a = ul( 
  'a') 
 
  # print(a.parent('#inner')) 
 
  # 兄弟元素的查找 
 
   li = doc_obj( 
  '.one') 
 
  # print(li.siblings()) 
 
  print(li.siblings( 
  '.two')) 
 
  # 遍历元素 
 
   ul = doc_obj( 
  '.list') 
 
  # generator object 
 
  # res = ul('li').items() 
 
  # # for li in res: 
 
  # # print(li) 
 
  # # # 获取标签对象的文本内容 
 
  # # print(li.text()) 
 
  # # # 获取标签属性 
 
  # # print(li.attr('class')) 
 
   inner_div = doc_obj( 
  '#inner') 
 
   p = inner_div( 
  'p') 
 
  print(p.text())

--夏天--

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3 ---- PyQuery

# pyquery：仿照jquery语法，封装的一个包，和bs4有点类似。from pyquery import PyQueryhtml = """ &lt;div id='content'&gt; &lt;ul class='list'&gt; &lt;li class='one'&gt;One&lt;/li&gt; &lt;li ...
复制链接

扫一扫