自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 python字体加密破解思路

company_name=item.xpath('./div[1]/div/p/a/text()')[1]#这样他把两个a标签都找到了,难怪会这样。city = item.xpath('.//span[@class="city ellipsis"]/text()')[0] #城市。job_name=item.xpath('.//a[@class="title ellipsis font"]/text()')[0]#职位。print('第{}页的链接是:{}'.format(i,url))

2024-04-07 23:04:00 618

原创 vscode控制台打印不全,按照别人的博客改了terminal设置还是不行的看这里。

我给朋友装vscode就是改错了,直挠头,怎么以前这里改3000就行,这次不行。是改上面的这里不是改下面的这里。

2024-03-09 22:52:59 518

原创 关于知乎滑动验证码我是怎么投降的

ActionChains(driver).drag_and_drop_by_offset(slide_button,x_transverse,0).perform()#动作链。jigsaw_rpg=cv2.imread('image/zhihu_img_pack_test/jigsaw_content.png',0)#读取小背景图。bg_im_rpg=cv2.imread('image/zhihu_img_pack_test/bg_img_content.png')#读取大背景图。

2024-02-16 23:09:54 1545 1

原创 selenium获取不到src,知乎获取背景图踩坑。

我就想是不是以为这个东西是异步加载的,链接加载慢,我time.sleep()就好了,还真是这样。它就好了,python明明单引号和双引号没区别的,既然玄学弄好了我就没管。然后今天又碰到了这个问题,我想起之前的玄学,但是这次没效果。以前我碰到过这种情况,然后我玄学弄好了,然后我加了换了双引号的"src"找class和style又可以。它就是获取不到src的值。

2024-02-10 17:45:05 262 1

原创 豆瓣如何让我泪流满面,男默女泪,关于知乎和豆瓣的滑动验证码破解的故事

我看了一篇关于如何破解豆瓣滑动验证码的博客后,跟着敲了一遍,然后其实我一开始是想破解知乎的滑动验证码的,然后找到的是豆瓣的,我想都是滑动验证码,就敲了豆瓣的。这是豆瓣的十张验证码图片,本来是十张的,但是我发现很多重复的,去掉重复的就这几张。知乎的图片非常复杂,简单的算周长和面积没用,下面是那个前面链接博主的代码。因为opencv根本找不到这个碎片的轮廓,所以上面的代码是行不通的。然后我想用他这个方法破解知乎的验证码,却一直出错,后来我知道了原因。# 计算轮廓的边界矩形,得到坐标和宽高。

2024-02-09 15:45:03 424

原创 关于imread()读取带中文的绝对路径问题。

path=r'F:\青jia汇\shan瑚课堂作业\爬虫部分\scrapy5\zhihu_spider_selenium_code.py\image\0279050000e89b4d0000000bb5e46b543015.png'然后别人说可以用plt加上encode读取。一般正常imread()读取是下面这样。这样碰到中文路径就歇逼了。我试了,这个没什么用。这个是真jiba好用。

2024-02-08 22:52:58 503

原创 关于cv2报错的邪门事件

然后我tm的到处找同款报错,没找到,但是搜类似的cv2报错是numpy的问题。我f盘的py文件都能运行,就是它桌面的py文件就不能运行,一直报错。当初没有记录报错的截图,在浏览记录里面还有,但是只有一半。我就把numpy卸载了,然后再运行它就是报错numpy。不知道为什么半天前都好好地,突然就报错了。我又安装回numpy,就好了。这里贴一个阿里云源的镜像地址。

2024-02-07 16:06:41 145 1

原创 关于这python的glob模块正则踩坑

事情是这样的,我想到要是能把某一个文件夹里面的文件 挨个拿出来进行处理就好了,后来才知道这个b是残废的正则,是以Unix shell风格的通配符。误会了,unix shell的通配符就真的只有下面的四个。它不能匹匹配^和$也就是以某某开头和某某结尾的正则格式。它可以通过正则 把匹配文件路径拿出来放在一个列表里面。正则和通配符的关系是: 正则是加强版本的通配符。2024,02,06 2:09追加。然后我发现,这怎么正则总是失败。然后我搜到了这个glob模块。不如人家re库的正则。

2024-02-06 02:23:41 144 1

原创 记录帖,关于chrome又自己更新了,我不得不更新chromedriver。

它chrome浏览器总是自己更新,然后我下载的chromedriver驱动就因为版本过低不能用了。path路径E:\python3.7.8-2022-10-24\chromedriver.exe。我把这些东西都删了,不知道为什么,pycharm还能运行selenium打开chrome。最有趣的时候来了,安装这个chromedriver别人博客写的就两种办法,但是我又忘记了怎么安装chromedriver的,得回去看别人的博客。一种是放在chrome浏览器的安装目录下,然后环境变量加上。

2024-02-04 14:46:34 168 1

原创 xpath定位含class属性里面有多个值的元素

div很容易有多个class的值,但是xpath获取又很麻烦。但是单独只用其中一个class的值定位就不行。也许这有点“火星救援”的味道。然后我看chrome的xpath插件这样写。这个太麻烦了,class值可以很多的。

2024-02-01 16:42:30 456 1

原创 selenium获取不到图片src的问题。有点邪门

然后折腾了很久后,我想不会是双引号的问题吧。事情是这样的,我发现我知乎那个验证码的图片定位不到它的链接。就这个上面的死活得不到。我又试了试获取其他的属性。这都是可以得到相应的属性的值,就src得不到。就可以得到src里面的链接了。我也不知道为什么这么邪门。

2024-01-28 22:40:47 203 1

原创 selenium cv2 破解豆瓣验证码

cv2.findContours()函数接受的参数为二值图,即黑白的(不是灰度图),所以读取的图像要先转成灰度的,再转成二值图,此处canny已经是二值图。ActionChains(driver).drag_and_drop_by_offset(slider,result,0).perform()#动作链。cv2.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2) # 画出矩行。后来发现这个人写的豆瓣的滑动验证破解,基本一样的。

2024-01-27 11:05:18 1786 1

原创 vscode run code输出乱码问题。

我一直用vscode的terminal终端运行,也就是右上角的run python file,或者debug python file,后来我用pycharm才发现,这pycharm怎么没有终端运行,默认就是run code,或者debug运行。然后点击确定,这个框就关闭了,再点击确定退出外面的大框。那岂不是,我从学python的第一天开始就没run code只会终端运行。用户变量和系统变量随便选一个,都写了也行。点击新建,然后写入这个。后来我想起来了,是因为run code会乱码,终端运行就不会。

2024-01-25 10:54:46 737

原创 vscode写python碰到的相对路径找不到目标文件夹的问题

with open()写入文件的时候,总是找不到文件夹,明明路径是对的。除非我用绝对路径,因为绝对路径又不是不能用,我就一直没管。然后输入@ext:ms-python.python exe。第一步打开自己的vscode,找到拓展,但是他这个,写的不够无脑,我给改一下。然后点右边的齿轮图标,选择拓展设置。就出问题,然后我找到了原因。再把这里勾上,就行了。

2024-01-21 16:52:43 856 1

原创 超级鹰破bilibili点选验证码

driver.find_element(By.CSS_SELECTOR,'body > div.geetest_panel.geetest_wind > div.geetest_panel_box.geetest_panelshowclick > div.geetest_panel_next > div > div > div.geetest_panel > a').click() #模拟单击验证码“确认"按钮。print('盒子的坐标',geetest_panel.location.values())

2024-01-19 16:06:24 403 1

原创 python获取房天下数据

headers={Win64;newdict={}

2023-10-18 15:06:29 68 1

原创 跟着b站爬取漫客栈漫画

视屏老师没敲完,说了个大概。我把它完善了,然后我也是意思了一下,没把这本灵剑尊爬完。print(image2_list,f'爬完了')

2023-08-03 10:48:13 217 1

原创 跟着b站视屏爬acfun视屏(m3u8)

import osimport repage=0headers={Win64;glab=0# exit()if glab>3:exit()"""page+=1。

2023-07-29 10:51:41 264

原创 跟着b站爬取某宝全部黑丝商品

记录用。就当是写日记似的,吧?

2023-07-23 23:24:41 156

原创 vscode配置flask环境

然后虚拟环境忘记了激活,前面的app.run()里面加上debug=True,不然它每次改动test.py的内容都要刷新。如果你和我一样不想的去某宝买激活码,免费的激活码没用,低版本的pycharm不用,非要用vscode的话,下面就是vscode如何配置flask的环境。然后在.venv同级目录随便新建一个test.py文件,因为这不是pycharm,你自己选的嘛。alt加左键这个划线的地址,或者你自己去随便一个浏览器输入这个地址都可以。return "你好,flask。先安装flask框架。

2023-06-26 00:26:53 1768

原创 selenium chrome闪退问题(大概已解决)

我就怀疑是不是这比chrome偷偷更新了,所以闪退,我就更新了chromedriver113.0.5672.63(这个是我浏览器的版本)我又以为是selenium版本高了,闪退,降低版本就好了,我从4.7降低到3.3,又降低到2.5。这是我更新chrome驱动的原因还是,我降低selenium版本后又更新驱动的共同作用我也不知道。现在一年后,不知道怎么搞得,它就开始闪退,加了上面的不自动关闭浏览器代码还是闪退。还有些说加input()阻断就不闪退了,就算加死循环它都闪退。这个,以前是加了就不闪退了,

2023-06-11 10:43:16 659 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除