![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 63
lsc。
有人质疑你的出身,有人嘲弄你的梦想,但是他没有看见你已开始奔跑
展开
-
爬取王者荣耀语音包
【代码】爬取王者荣耀语音包。原创 2023-09-21 09:44:09 · 209 阅读 · 0 评论 -
python爬虫—requests
r.encoding :访问或定制编码方式。r.status_code :响应的状态码。类型 : models.Response。r.content :响应的字节类型。r.headers :响应的头信息。r.url :获取请求的 url。r.text : 获取网站源码。原创 2023-09-01 18:07:44 · 2575 阅读 · 1 评论 -
python爬虫-Selenium
Selenium是一个用于Web应用程序测试的工具,Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。模拟浏览器功能,自动执行网页中的js代码,实现动态加载。原创 2023-09-01 17:45:12 · 2260 阅读 · 0 评论 -
python爬虫-数据解析BeautifulSoup
BeautifulSoup和lxml类似,既可以解析本地文件也可以响应服务器文件。缺点:效率没有lxml的效率高。优点:接口设计人性化,使用方便。原创 2023-09-01 17:21:58 · 1902 阅读 · 0 评论 -
python爬虫数据解析xpath
下载好文件后会得到一个没有扩展名的文件,重命名该文件将其改为.rar或者.zip等压缩文件,解压之后会得到一个.crx文件和一个.pem文件。新建一个文件夹,将这两个文件放在该文件夹(本人将其命名为xpath-helper)内。将.crx文件重命名,改为.rar或.zip文件,解压在xpath-helper文件夹中,解压后会得到许多文件如下图。想要使用xpath,我们还必须安装一个名为lxml的库,这个库安装的目录必须在python的解释器路径下。打开Chrome浏览器,进入扩展程序页面,选择右上角的。原创 2023-09-01 17:12:41 · 1349 阅读 · 0 评论