自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 urllib3.exceptions.MaxRetryError: HTTPConnectionPool(host=‘127.0.0.1’, port=10487): Max retries exce

这个问题出现,引起报错的原因是代码中出现quit()

2024-09-23 17:33:28 149

原创 python 登录下载附件 没有后缀

【代码】python 登录下载附件 没有后缀。

2024-02-28 17:12:50 279

原创 undetected_chromedriver 指定版本号

【代码】undetected_chromedriver 指定版本号。

2023-09-18 10:31:24 613

原创 selenium.common.exceptions.TimeoutException: Message: timeout: Timed out receiving message from rend

2、添加不加载图片设置,提升速度:chrome_options.add_argument('blink-settings=imagesEnabled=false')1、临时解决方法:chrome_options.add_argument('--headless'),该‘浏览器不提供可视化页面’设置去掉。根本原因是加载内容过多,导致的超时。

2023-08-21 09:07:56 2105

原创 python num循环怎么从1开始

如何实现python for循环从1开始?

2023-08-12 17:21:20 515

原创 python selenium 刷新页面

【代码】python selenium 刷新页面。

2023-07-28 10:12:33 257

原创 遍历li_all里面的值

忘了的时候记得翻出来看看。

2023-07-05 15:13:14 77

原创 UserAgent 报错->FakeUserAgent.__init__() got an unexpected keyword argument ‘path‘

直接用fake_useragent随机生成useragent时,经常出现timeout错误,可以把json文件手动下载回来,用path参数指定这个json的路径uaUserAgentpath上述方法在旧版(版本号0.1.11)中可用,但是在新版的fake_useragent(版本号1.0.1)中报错:__init__'path'解决方法是把path改成cache_path,即uaUserAgent(cache_path。

2023-07-04 16:02:40 1999

转载 Python+Selenium自动化-获取页面信息

【代码】【无标题】

2023-07-03 11:16:33 1905

原创 python 转换句柄报错 self.browser.switch_to.window(windows[1])IndexError: list index out of range

【代码】python 转换句柄报错 self.browser.switch_to.window(windows[1])IndexError: list index out of range。

2023-06-13 09:38:06 144

原创 python txt覆盖

【代码】python txt覆盖。

2023-05-12 10:15:18 340

原创 python token 时间戳 替换-------------------request

【代码】python token 时间戳 替换-------------------request。

2023-05-11 09:20:28 134

原创 selenium处理滑块验证码(最简单的滑块)

解决上面的滑块验证,这种只要用鼠标点击并移动指定距离就可以完成验证(x轴)

2023-04-21 16:47:16 644

原创 ImportError: cannot import name webdriver

因为在这个Project里新建了一个叫。所以导入模块时会先从这个文件中导入。

2023-04-12 08:35:40 167

原创 python IP代理

各大网站爬取代理并将代理保存到储存模块。1.ip3366网站。

2023-03-22 16:27:31 91

原创 python-异步爬虫(1)

【代码】python-异步爬虫(1)

2023-03-07 17:08:39 373

原创 python连接redis

1.下载安装redis。

2023-03-04 17:26:04 129

原创 注:result_2[0][0]+result_2[0][1] 循环的意思

debug中result_2是个tuple。

2023-02-13 15:23:26 234

原创 python 删除以csv结尾后缀的文件

【代码】python 删除以csv结尾的文件。

2023-02-13 15:09:30 266

原创 python sql数据库 update更新语句

【代码】python sql数据库 update更新语句。

2023-02-08 14:43:27 1497

转载 UnboundLocalError: local variable ‘len’ referenced before assignment

变量名称和函数名重复了。改为 xlen = len(list1),再执行就没有问题了。

2023-02-06 17:40:51 596

原创 python发邮件 含附件形式

【代码】python发邮件 含附件形式。

2023-02-02 14:08:36 813

转载 python 发邮件

【代码】python 发邮件。

2023-02-01 14:16:14 157

原创 request 解决内容拼接

html+request抓取的字段。

2022-11-24 17:55:21 206

原创 关于Max retries exceeded with url: / (Caused by SSLError(SSLError(1, ‘[SSL: CERT报错

【代码】关于Max retries exceeded with url: / (Caused by SSLError(SSLError(1, '[SSL: CERT报错。

2022-11-24 16:09:49 2990

原创 关于for i in rang(num)翻页中的i

【代码】关于for i in rang(num)翻页中的i。

2022-08-22 13:39:28 548

原创 python selenium 下载附件通过oss上传

1.用的是selenium写的,进行抓包获取headers和cookie。3.内容页链接的uuid和抓包中的uuid,2.因为附件无链接,需要uuid进行拼取。

2022-08-02 17:01:42 1792

原创 python 判断数据延期以及数据去重

a.通过去重确定是否为旧数据,可以根据标题判断,进行对比取到的时间是否一致,不一致则为延期信息。b.爬取网站动态链接.click进行跳转的网站。a.根据时间,标题,url进行判断。

2022-08-02 16:53:12 172

原创 selenium click点击 跳转新页面转句柄

代码】seleniumclick点击跳转新页面转句柄。

2022-07-22 14:59:11 3217

原创 python测试开发django(17)--admin后台自定义显示

之前遇到的问题1.创建djiango的admin页面的时候,页面格式出错,不是下图这样的原因:2.数据库建表,迁移出错我是直接简单粗暴把数据表全删了,重新建的,保留init,其他的都删了,数据库对应的也删了3.然后目前出错的是django admin 中的list_display设置了,但是页面没有显示出来列原因:借鉴:python测试开发django(17)--admin后台自定义显示 - 星空6 - 博客园只记录自己出错的地方,需要学习去这个大佬博客上看......

2022-06-22 17:05:35 476

原创 python测试开发django(2)--templates模板与html页

2.wenny/views.py中添加3.在fristdemo/urls.py4.打开浏览器输入 http://127.0.0.1:8000/haha运行成功

2022-06-09 09:42:59 177

原创 python测试开发django(1)--Hello World!

fristdemo:项目的容器,可以随便命名。manage.py:一个让你用各种方式管理Django项目的命令行工具。__init__.py:一个空文件,告诉Python这个目录应该被认为是一个python包。settings.py:Django项目的配置文件。urls.py:Django项目的URL声明,就像你网站的“目录”。wsgi.py:作为你的项目的运行在WSGI兼容的Web服务器上的入口。ps:怎么建立app项目见上一个文章出现这个页面即表示成功django服务默认在8000端口启动,如果想换个端

2022-06-08 16:20:26 204

原创 pychram搭建django

记录

2022-06-01 16:48:47 121

原创 尝试wordcloud

"""@Time : 2022/2/9 16:33@Author : Wenny@File :test5.py@IDE :PyCharm"""# coding=utf-8from wordcloud import WordCloudfrom PIL import Imageimport numpy as npimport matplotlib.pyplot as pltimport jieba#打开文件text = open("xyj.txt",encoding = 'u.

2022-02-10 14:04:00 145

原创 日常学习--练手

1.page_source爬取页面源码from selenium import webdriverimport redriver = webdriver.Chrome()driver.get('https://www.cnblogs.com/canglongdao')rs=driver.page_source.encode("utf-8")link = re.findall('href="(.+?)"',str(rs))list =[]for i in link: if 'ht

2022-01-26 14:38:47 762 2

原创 selenium判断元素是否存在

import webbrowserfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsdef start(browser,xpath): baidu = browser.find_elements_by_xpath(xpath) if len(baidu)!=1: print("定位到{}".format(len(baidu))) re.

2022-01-26 14:05:01 1023 1

原创 百姓网城市--省,市,爬取

import pymysqlfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsdb = pymysql.connect(host='1', user='1', password='1', database='1')cursor = db.cursor()def insert_data(province, city, url, db, cursor): try: .

2022-01-18 09:33:25 550

原创 request请求 下载附件

首先获得form data的数据请求成功则返回如图数据我们现在要获得的数据是当前的 UUID存储获得form data数据http://www.sprtc.com/idtAppServiceV6/exclude/control/getFiles tableId: 47c2c46b4fb4bd97014fb4db962103b2uuid: 624317d2737311eca46f83338f6274b2fieldName: XMFJCLdeveloper: sjs...

2022-01-13 16:18:11 8505 2

原创 Python自动化测试,如何调整浏览器窗口大小,前后翻页,刷新浏览器页面。

#浏览器窗口大小设置#前后翻页#刷新页面from selenium import webdriverfrom time import sleep#启动浏览器driver=webdriver.Firefox()driver.get('https://blog.csdn.net/Taxus_shan/article/details/90293018')#自定义浏览器大小800*600driver.set_window_size(800,600)sleep(2)#窗口最大化driver.

2022-01-12 13:35:52 1540

原创 request 请求8749

import requestsfrom bs4 import BeautifulSoup as bsdef start(): headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36"} html = requests.get('http://www..

2022-01-06 17:28:36 321

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除