自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 记录curl_cffi使用https代理访问的坑

查看源代码得知/etc/ssl/certs/ca-certificates.crt为ubuntu系统路径,但是服务器为centos系统,路径应为/etc/pki/tls/certs/ca-bundle.crt.然后我尝试设置verify="/etc/pki/tls/certs/ca-bundle.crt"和curl路径为/etc/pki/tls/certs/ca-bundle.crt都报这个错。没错,他的https设置的代理是http协议,我最开始以为是他写错了。

2024-05-23 16:36:46 872

原创 异步协程爬虫模板

【代码】异步协程爬虫模板。

2023-09-04 13:56:31 926

原创 关于python Gui库tkinter中按钮绑定函数变量值无法获得的解决思路

众所周知,Python的Gui组件向来都不是很好用。在使用Python原生GUI库tkinter的时候,遇到了一些非常抓马的事情。调用按钮组件的时候,按钮执行后的变量值获取不到。

2023-08-29 10:07:40 296 1

原创 selenium网课自动化

在属性为“orangeNew”的span标签下还有未看完的任务点数量,可以通过获取该信息来确定应当遍历的视频数量。在视频页面可以发现,当不点击“播放”时不会显示视频的时长,播放视频后才有视频的时长。,同理找到登录的位置。通过selenium的鼠标模拟,选择所在学校的单位(若直接显示了课程可略过),定位课程之前要进入一个。通过link文本的方式来定位课程,注意,只有当文本有link链接时才可用该定位方式。F12进入开发者模式,找到两个文本框的位置,用css路径寻址,两个框的路径分别为。来定位到任务点的视频。

2022-11-16 12:59:26 746

原创 Header editor recapcha解决人机验证——kaggle为例打开Internet

在火狐的拓展工具搜索Header Editor安装之后在百度搜索“header editor recapcha”,选择Google人机验证(https://blog.azurezeng.com/recaptcha-use-in-china/)进入第二步导入配置导入在线配置(GitHub,推荐) https://azurezeng.github.io/static/HE-GoogleRedirect.json(本站服务器) https://www.azurezeng.com/static/HE-G

2022-05-11 19:30:33 8198 2

原创 踩坑记录——ProxyServer删除问题经验分享

ProxyServer删除问题最近在写爬虫的时候碰到“由于计算机积极拒绝,无法连接”的问题,之前我就遇到过一次,是由于用了V P N才导致代理被修改。它会在注册表“计算机\HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersion\Internet Settings”路径下新建一个“ProxyServer”,删除这个值问题会得到解决。但是它过一会会自动又新建回来,当时是卸载代理才成功解决问题。这两天在逛kaggle的时候又下回了那个代理,然后

2022-03-14 23:11:05 2027

原创 画师通每日榜单爬取

画师通每日榜单爬取步骤用selenium初始化webdriver驱动css寻址获得榜单所有图片的链接循环遍历所有的链接并解析页面信息re正则表达式匹配链接保存图片导入工具箱import reimport timeimport requestsfrom selenium import webdriverfrom bs4 import BeautifulSoup初始化webdriver#设置浏览器,executable_path为驱动存放的路径driver = webdriv

2021-10-18 09:52:27 180

原创 排班表统计小程序

统计排班表人员的被排班次数最近我们组织安排招新,我负责制作排版表,为了避免一个人被排班很多次,于是我想写一个统计被排版次数的程序,用的都是一些基本的列表知识和一些方法,写的有点水,emmm。import pandas as pdfrom collections import Counterdata = pd.read_excel('F:\zhaoxin.xlsx',skiprows=1)#skiprows表示读取不要的行数hang,lie = data.shape#获得表格数据的行列数建议把

2020-10-11 00:05:43 1543 2

原创 求训练集的熵和信息增益

求训练集的熵和信息增益代码如下:import mathL = ['S','S','I','M','I','M','M','I','M','S']F = ['S','I','M','M','M','I','S','M','S','S']H = ['N','Y','Y','Y','Y','N','N','N','Y','Y']R = ['N','Y','Y','Y','Y','Y','N','Y','Y','N']def H_R(data): #求R熵的函数 Y,N = 0,0

2020-09-19 14:18:36 1537 3

原创 小白的日常探索

鸭鸭的学习的日常在学习Python的过程中,对于if语句有一个疑惑:在if语句进行判定的时候是否能对字符串生效。第一次写的代码name1 = input("请输入你的名字:")name2 = input("谁是104最憨的人:")print("\n")if name2 == 张三: print("{}你真聪明".format(name1)) for i in range(5): print("{}是个憨憨".format(name2)) el

2020-09-02 23:21:39 501 5

原创 第一次写博客

第一次的博客从今天开始我就要入住CSDN了,这里是学习开始的地方,作为一个编程小白,有很多知识需要学习,就从一个可爱废物开始吧!

2020-09-01 17:39:13 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除