自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 DrissionPage元素定位

4)相对查找:父元素.child()/children()/before()/next()/prev()/after()/prevs()/afters()/parent()作用:返回文档中当前元素前面符合条件的一个元素,可用查询语法筛选,可指定返回筛选结果的第几个。如果网页只有一个class属性值,可以直接使用ele()定位,如果有多个,需指定index来定位自己所需的元素。适用范围:某个嵌套在内部的元素很好定位,但其需定位的元素不好定位,但这二个元素的距离在结构上不远。或许我还没有理解其真正的作用。

2024-06-23 18:52:49 2699 1

原创 【无标题】DrissionPage模块(七)

DrissionPage模块(七)

2024-06-23 12:48:17 1064

原创 DrissionPage模块(六)

DrissionPage模块(六)

2024-06-23 12:32:30 1097

原创 DrissionPage模块(五)

path: ini文件的路径, None 保存到当前读取的配置文件,传入 'default' 保存到默认ini文件。设置load_mode,可接收 'normal', 'eager', 'none'path: ini文件的路径,传入 'default' 保存到默认ini文件。path: ini文件的路径,传入 'default' 保存到默认ini文件。value: 可接收 'normal', 'eager', 'none'返回页面加载策略,'normal', 'eager', 'none'

2024-06-03 13:23:49 659

原创 DrissionPage模块(四)

返回文档中当前元素前面符合条件的一个元素,可用查询语法筛选,可指定返回筛选结果的第几个,查找范围不限同级元素,而是整个DOM文档。返回文档中当前元素后面符合条件的一个元素,可用查询语法筛选,可指定返回筛选结果的第几个,查找范围不限同级元素,而是整个DOM文档。返回文档中当前元素后面符合条件的一个元素,可用查询语法筛选,可指定返回筛选结果的第几个,查找范围不限同级元素,而是整个DOM文档。返回当前元素前面一个符合条件的同级元素,可用查询语法筛选,可指定返回筛选结果的第几个。

2024-06-03 13:18:17 820

原创 DrissionPage模块(三)

返回第一个符合条件的元素、属性或节点文本locator::元素的定位信息,可以是元素对象,loc元组,或查询字符串index: 获取第几个,从1开始,可传入负数获取倒数第几个timeout: 查找元素超时时间,默认与页面等待时间一致return: 调用_ele()的结果,即元素对象或属性、文本节点文本调用了本类的方法timeout,返回所有符合条件的元素、属性或节点文本locator::元素的定位信息,可以是元素对象,loc元组,或查询字符串。

2024-05-22 13:06:28 1067 1

原创 DrissionPage模块(二)

param as_bytes: 是否以字节形式返回图片,可选 'jpg','jpeg','png','webp',生效时path参数和as_base64参数无效。:param as_base64: 是否以base64字符串形式返回图片,可选 'jpg','jpeg','png','webp',生效时path参数无效。html_or_info: 新元素的html文本或信息。:param name: 完整文件名,后缀可选 'jpg','jpeg','png','webp'

2024-05-21 02:46:34 644

原创 类变量和属性的区别和访问

3. 类变量的外部访问,可以'实例名.类变量'的形式访问,也可以直接以'类名.类变量'的形式访问。2. 属性定义必须在方法内定义,且需加上实例在方法中的代称self;7. 类变量是类的数据共享空间,无论是在任何同类实例的内部或外部,均可改变类变量的值。6. 属性在方法内防问,以'self.属性名'方式访问,且不能在类方法中使用。如果方法为类方法,则要加类的代称cls限可,即'cls.类变量'如果方法不是类方法,则直接以类名访问,即'类名.变量名'4. 属性的外部访问只能以'实例名.属性名'的形式访问。

2024-05-21 02:03:43 171

原创 DrissionPage模块(一)

DrissionPage模块的分析

2024-05-20 22:58:39 2041 1

原创 scrapy模拟POST登录

一、利用已获取的cookies绕过POST请求,对url直接进行GET请求其一般在下载中间件调整,也可以在爬虫中间件调整在下载中间件project_nameSpiderMiddleware类中有个方法process_request(),修改请求参数都在这个方法内。(1)在settings.py中打开DEFAULT_REQUEST_HEADS,增加cookie:cookies_str键值对。(2)利用request.headers[‘cookie’]设置。

2024-05-14 02:39:37 713 2

原创 scrapy的全网站爬取数据

scrapy的全网站爬取数据

2024-05-13 00:51:49 393 2

原创 scrayp创建爬虫的流程

用scrapy创建爬虫

2024-05-12 01:49:09 425

原创 手工配置miniconda3的虚拟环境

miniconda3的虚拟环境

2024-05-11 13:27:14 595

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除