python
文章平均质量分 78
lsc。
有人质疑你的出身,有人嘲弄你的梦想,但是他没有看见你已开始奔跑
展开
-
python爬虫—requests
r.encoding :访问或定制编码方式。r.status_code :响应的状态码。类型 : models.Response。r.content :响应的字节类型。r.headers :响应的头信息。r.url :获取请求的 url。r.text : 获取网站源码。原创 2023-09-01 18:07:44 · 2501 阅读 · 1 评论 -
python爬虫-Selenium
Selenium是一个用于Web应用程序测试的工具,Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。模拟浏览器功能,自动执行网页中的js代码,实现动态加载。原创 2023-09-01 17:45:12 · 2224 阅读 · 0 评论 -
python爬虫-数据解析BeautifulSoup
BeautifulSoup和lxml类似,既可以解析本地文件也可以响应服务器文件。缺点:效率没有lxml的效率高。优点:接口设计人性化,使用方便。原创 2023-09-01 17:21:58 · 1823 阅读 · 0 评论 -
python爬虫数据解析xpath
下载好文件后会得到一个没有扩展名的文件,重命名该文件将其改为.rar或者.zip等压缩文件,解压之后会得到一个.crx文件和一个.pem文件。新建一个文件夹,将这两个文件放在该文件夹(本人将其命名为xpath-helper)内。将.crx文件重命名,改为.rar或.zip文件,解压在xpath-helper文件夹中,解压后会得到许多文件如下图。想要使用xpath,我们还必须安装一个名为lxml的库,这个库安装的目录必须在python的解释器路径下。打开Chrome浏览器,进入扩展程序页面,选择右上角的。原创 2023-09-01 17:12:41 · 1330 阅读 · 0 评论 -
python 文件、文件夹详细操作
os 可以执行简单的文件夹及文件操作,引入用 import os,可用 help(os) 或是 dir(os) 查看其用法。创建文件夹可能会出错,原因具体有:(1) path 已存在时(不管是文件还是文件夹) (2) 驱动器不存在 (3) 磁盘已满 (4) 磁盘是只读的或没有写权限。在上方示例的文件夹基础上,操作删除 test1 文件夹 (空文件夹可用 os.rmdir() ),删除 test_mkdir 及其下所有文件();在os文件夹中新建文件夹 test,文件 test.txt。原创 2023-02-27 23:38:08 · 934 阅读 · 1 评论