前言:
今天为大家带来的内容,是五步教会你用python爬虫神器PyQuery!(内含详细步骤和代码),在这里还是要啰嗦下,为了有更好的观赏性,大部分代码用图片的方式呈现出来!喜欢的话不忘点赞关注不迷路哦!
PyQuery库官方文档
- 初始化为PyQuery对象
- 常用的CCS选择器
- 伪类选择器
- 查找标签
- 获取标签信息
初始化为PyQuery对象
相当于BeautifulSoup库的初识化方法,将html转化为BeautifulSoup对象。
bsObj = BeautifulSoup(html, 'html.parser')
PyQuery库也要有自己的初始化。
1 将字符串初始化
from pyquery import PyQuery as pq #初始化为PyQuery对象 doc = pq(html) print(type(doc)) print(doc)
返回
2 将html文件初始化
#filename参数为html文件路径 test_html = pq(filename = 'test.html') print(type(test_html)) print(test_html)
返回
3 对网址响应进行初始化
response = pq(url = 'https://www.baidu.com') print(ty