自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

鑫展阁的博客

世界磅礴冗大,如何找到自己。

  • 博客(13)
  • 收藏
  • 关注

原创 D7 极验滑动验证

from selenium import webdriverfrom selenium.webdriver import ActionChainsfrom PIL import Imageimport timeimport randomdef main(): driver = webdriver.Chrome() driver.implicitly_wait(10)...

2019-06-21 23:04:16 179

原创 D6 Xpath学习

XPath学习XPath简介XPath是一个查找XML元素的语言,用于查找XML文档种的标签和属性XPath是W3C XSLT标准的主要元素,XPoint和XQuery都构建于其之上XPath是XML高级应用的基础是一个标准的函数库学习XPath应该具备的知识基础HTML/XHTMLXHTML是更严谨更纯净的HTML语言XML/XML命名空间XML扩展标记语言1998年2...

2019-06-21 22:27:04 100

原创 D6 CSS外部选择器的三种方法

在外部导入css时,需要选择html中的元素对其修饰选择的方式有三种一、id选择器以‘#’开头#red {color:red;}#green {color:green;<p id="red">这个段落是红色。</p><p id="green">这个段落是绿色。</p>查找到的元素 siadebar->p二、类选择器以‘....

2019-06-21 21:47:15 398

原创 D5 登录抽屉新热榜

D5 登录抽屉新热榜使用selenium实现抽屉新热榜的自动登录实现原理:模拟打开谷歌浏览器最大化窗口查找登录按钮的位置并点击查找用户名输入栏的位置并输入用户名查找密码输入栏的位置并输入密码等待1秒查找登录按钮的位置并点击出现的问题与解决直接打开页面后,点击不到登录按钮解决:在打开窗口后最大化窗口输入用户名与密码后,无法点击登录按钮解决:在输入完用户名和密码后等待...

2019-06-21 21:44:09 340

原创 D5 selenium的基本使用

什么是selenium自动化测试工具,可以驱动浏览器在爬虫中使用是主要为了解决无法使用javascript的问题如登录验证问题。为什么要使用selenium优点:使用requests模块登录需要分析大量的复杂通信流程,使用selenium可以轻松跳过登录验证缺点:浏览器会加载css、js、图片、视频等代码,其爬虫效率比requests要低很多使用selenium的准备安装pip...

2019-06-21 20:22:39 134

原创 D5 respond的基本使用

相关代码如下import requestsresponse = requests.get('https://baidu.com')print(response.status_code) # 获取响应状态码print(response.url) # 获取url地址print(response.encoding) # 字符编码response.encoding = 'utf-8'...

2019-06-21 19:41:41 116

原创 D5 使用requests的post请求,爬取GitHub登录界面

Github登录界面: https://github.com/login登录时的Post请求信息generala. Request URL: https://github.com/sessionb. Request Method: POSTRespond HeadersRequest Headersa. Cookie: has_recent_activity=1; logged_i...

2019-06-21 19:24:37 898

原创 D4 爬取豆瓣Top250

Top250分析页面之间的关系每个页面显示25条信息url实际地址https://movie.douban.com/top250?start=(x),x为页面第一个电影的序号-1一共有十个页面解析所需要的内容通过re正则表达式解析<li> <div class="item"> <div clas...

2019-06-21 19:10:04 166

原创 Day4 uuid的使用

uuid介绍1. uuid简介 a. UUID(Universally Unique Identifier),通用唯一识别码,通过字面意思可以看出,其功能是为了唯一标识元素。 b. 可以保证在时间和空间上唯一,是通过MAC地址,时间戳,命名空间,随机数,伪随机数保证 ID的唯一性,128bit。2. uuid在python中的使用 uuid模块 a. uuid1:基于时间戳 b. ...

2019-06-21 18:17:14 3583

原创 D3 名称空间

1. 什么是名称空间 a. 名称空间:存放名称的地方,用于确定 标识符与对象绑定关系 2. 名称空间的加载顺序 a. 内置名称空间 b. 执行py文件时的全局名称空间 c. 在执行过程中调用函数时的局部名称空间3. 标识符的查找顺序 a. 类似一个堆栈,加载时后加载的先查找 b. 故查找顺序与名称空间加载顺序相反 c. 在局部可以查看到全局的名称空间,但是在全局查看不了局部的...

2019-06-21 08:47:31 147

原创 D3 函数和模块

1. 什么是函数 a. 函数是完成一定功能的程序段的封装,使用者无需理解函数是如何实现,只需了解函数的使用方法 2. 什么是模块、包、库 a. 模块是由多个函数和多个变量,物理上,模块对应py文件 b. 包是多个模块的集合,物理上对应包含多个py文件的文件夹 c. 库是多个包的集合,物理上对应包含多个包的文件夹 3. 模块的导入方式 a. import 模块名 i. 通过此种...

2019-06-21 08:43:53 423

原创 Python Day2

Day2复杂数据类型补充列表补充插入数据取出数据删除数据统计数据获得索引清除列表合并数据反转列表排序数据相关复制操作Python中内存的理解小数据池的理解为了重用数据,整形和短字符串在默认条件下,会只保存一个对象,用其赋值其实是该对象的一个引用-5~256整形,21位内的字符串会使用小数据池容器的引用简单复制(a=b),会将a引用,b引用对象内...

2019-06-13 01:28:32 83

原创 Python Day1 作业

Day1 作业课堂实例# DAY01# demo_1.py# 2019.06.11#字符串操作str = 'my name is zzh, my age is 21.'str1 = ' my name is zzh, my age is 21. '#get value from indexprint(str[3],str[5])# n m#get sectio...

2019-06-12 00:00:45 147

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除