- 博客(3)
- 收藏
- 关注
原创 使用Python比较两个tar包内不同内容的文件
需求: 使用Python区分新旧两个tar包内不同内容的文件,输入为新旧两个tar包,输出为一个.txt文件,记录两个包内不同文件在包内的完整路径 环境: python3.6 文件路径为window下风格 具体实现 废话不多说,直接贴代码 方法一:获取到包内所有文件的路径后进行暴力循环 import sys import hashlib import tarfile import...
2020-03-26 18:00:16 546
转载 scrapy 使用中间件实现随机选择User_Agent以及Proxy
1.准备列表User_Agent USER_AGENTS = [ "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)", ...
2018-08-14 09:14:57 448
转载 selenium中设置页面等待
页面等待 这很重要!!! 现在的网页越来越多采用了Ajax技术,这样程序便不能确定何时某个元素完全加载出来了。如果实际页面等待时间过长导致某个dom元素还没出来,但是你的代码直接使用了这个WebElement,那么就会抛出空指针的异常。 为了避免这种元素定位困难而且会提高产生ElementNotVisibleException的概率。所以Selenium提供了两种等待方式,一种是隐式等待,一...
2018-08-13 23:25:29 579
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人