进网页需要验证码？不好意思，Python从来不惧各种验证码！

2401_84688608

于 2024-04-29 23:03:16 发布

阅读量574

点赞数 7

分类专栏：程序员文章标签： python 前端 javascript

本文链接：https://blog.csdn.net/2401_84688608/article/details/138328548

版权

程序员专栏收录该内容

115 篇文章 0 订阅

订阅专栏

我们的第一个思路就是

下载这两张原始图片

然后通过偏移量合成两张真正的图片

背景图

↓变身

缺口图

↓变身

那么怎么做呢？

因为我们还要模拟滑动滑块

所以呢

我们要用到 selenium

打开b站的登录页

然后等到那个滑块显示出来

获取滑块按钮

driver.get(url)

slider = WAIT.until(EC.element_to_be_clickable(

(By.CSS_SELECTOR, “#gc-box > div > div.gt_slider > div.gt_slider_knob.gt_show”)))

接下来我们就获取页面的源码

driver.page_source

然后使用 bs 获取两张原始背景图片的 url

bs = BeautifulSoup(driver.page_source,‘lxml’)

找到背景图片和缺口图片的div

bg_div = bs.find_all(class_=‘gt_cut_bg_slice’)

fullbg_div = bs.find_all(class_=‘gt_cut_fullbg_slice’)

获取缺口背景图片url

bg_url = re.findall(‘background-image:\surl(“(.*?)”)’,bg_div[0].get(‘style’))

获取背景图片url

fullbg_url = re.findall(‘background-image:\surl(“(.*?)”)’,fullbg_div[0].get(‘style’))

拿到了图片地址之后

将图片下载下来

将图片格式存为 jpg 格式

bg_url = bg_url[0].replace(‘webp’, ‘jpg’)

fullbg_url = fullbg_url[0].replace(‘webp’, ‘jpg’)

print(bg_url)

print(fullbg_url)

下载图片

bg_image = requests.get(bg_url).content

fullbg_image = requests.get(fullbg_url).content

print(‘完成图片下载’)

我们已经把两张原始图片下载下来了

那么接下来就是要合成图片了

我们要根据图片的位置来合成

也就是源码中的 background-position

获取每一个小图片的位置

我们可以通过字典的形式来表示这些位置

然后将数据放到列表中

存放每个合成缺口背景图片的位置

bg_location_list = []

存放每个合成背景图片的位置

fullbg_location_list = []

for bg in bg_div:

location = {}

location[‘x’] = int(re.findall(‘background-position:\s(.?)px\s(.?)px;’, bg.get(‘style’))[0][0])

location[‘y’] = int(re.findall(‘background-position:\s(.?)px\s(.?)px;’, bg.get(‘style’))[0][1])

bg_location_list.append(location)

for fullbg in fullbg_div:

location = {}

location[‘x’] = int(re.findall(‘background-position:\s(.?)px\s(.?)px;’, fullbg.get(‘style’))[0][0])

location[‘y’] = int(re.findall(‘background-position:\s(.?)px\s(.?)px;’, fullbg.get(‘style’))[0][1])

fullbg_location_list.append(location)

那么

现在我们已经有了原始图片

还知道了每个位置应该显示原始图片的什么部分

接下来我们就写一个方法

用来合成图片

写入图片

bg_image_file = BytesIO(bg_image)

fullbg_image_file = BytesIO(fullbg_image)

合成图片

bg_Image = mergy_Image(bg_image_file, bg_location_list)

fullbg_Image = mergy_Image(fullbg_image_file, fullbg_location_list)

那么问题又来了

怎么合成啊

我们再看看一开始分析的图片

这里图片被分割成的每一个小图片的尺寸是

10 * 58

所以我们也要将我们刚刚下载的原始图片切割成相应的尺寸大小

而且

这张图片是由上半部分的小图片和下半部分的小图片合成的

所以我们定义两个 list 来装这些小图片

存放上下部分的各个小块

upper_half_list = []

down_half_list = []

然后将原始的图片切割好放进去

image = Image.open(image_file)

通过 y 的位置来判断是上半部分还是下半部分,然后切割

for location in location_list:

if location[‘y’] == -58:

间距为10，y：58-116

im = image.crop((abs(location[‘x’]), 58, abs(location[‘x’])+10, 116))

upper_half_list.append(im)

if location[‘y’] == 0:

间距为10，y：0-58

im = image.crop((abs(location[‘x’]), 0, abs(location[‘x’]) + 10, 58))

down_half_list.append(im)

至此

我们这两个 list 就分别放好了各个切割的图片了

那么接下来就创建一张空白的图片

然后将小图片一张一张（间距为10）的粘贴到空白图片里

这样我们就可以得到一张合成好的图片了

哎

我真是个天才

创建一张大小一样的图片

new_image = Image.new(‘RGB’, (260, 116))

粘贴好上半部分 y坐标是从上到下（0-116）

offset = 0

for im in upper_half_list:

new_image.paste(im, (offset, 0))

offset += 10

粘贴好下半部分

offset = 0

for im in down_half_list:

new_image.paste(im, (offset, 58))

offset += 10

那么到现在

我们可以得到网页上显示的那两张图片了

一张完全的图片

一张带缺口的图片

接下来我们就要通过对比这两张图

看看我们要滑动的距离是多远

合成图片

bg_Image = mergy_Image(bg_image_file, bg_location_list)

fullbg_Image = mergy_Image(fullbg_image_file, fullbg_location_list)

bg_Image.show()

fullbg_Image.show()

计算缺口偏移距离

distance = get_distance(bg_Image, fullbg_Image)

print(‘得到距离：%s’ % str(distance))

可以通过图片的 RGB 来计算

我们设定一个阈值

如果 r、g、b 大于这个阈值

我们就返回距离

def get_distance(bg_Image, fullbg_Image):

#阈值

threshold = 200

print(bg_Image.size[0])

print(bg_Image.size[1])

for i in range(60, bg_Image.size[0]):

for j in range(bg_Image.size[1]):

bg_pix = bg_Image.getpixel((i, j))

fullbg_pix = fullbg_Image.getpixel((i, j))

r = abs(bg_pix[0] - fullbg_pix[0])

g = abs(bg_pix[1] - fullbg_pix[1])

b = abs(bg_pix[2] - fullbg_pix[2])

if r + g + b > threshold:

return i

现在

我们知道了关键的滑动距离了

激动人心的时刻到了

我们使用 selenium

拿到滑块的元素

然后根据这个距离拖动到缺口位置不就好了么

马上打开 selenium 的文档

看到了这个函数

它可以使用左键点击元素

然后拖动到指定距离

最后释放鼠标左键

挖槽

正合我意

赶紧试一下

knob = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, “#gc-box > div > div.gt_slider > div.gt_slider_knob.gt_show”)))

ActionChains(driver).drag_and_drop_by_offset(knob, distance, 0).perform()

运行一下试试看吧

哇哦你妹哦～

妖怪吃了拼图了

看来直接拖拽是不行的

容易遇到妖怪

毕竟这太快了

就算加藤鹰也没那么快吧

我试着拖完滑块让它睡一下再释放

ActionChains(driver).click_and_hold(knob).perform()

ActionChains(driver).move_by_offset(xoffset=distance, yoffset=0.1).perform()

time.sleep(0.5)

ActionChains(driver).release(knob).perform()

发现拼图还是特么的被妖怪吃了

后来发现原来别人也遇到了这样的问题

然后又发现了

有个叫匀速直线运动的东西

什么加速度

最后

Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

👉Python所有方向的学习路线👈

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

👉Python必备开发工具👈

工欲善其事必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。

👉Python全套学习视频👈

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

👉实战案例👈

学python就与学数学一样，是不能只看书不做题的，直接看步骤和答案会让人误以为自己全都掌握了，但是碰到生题的时候还是会一筹莫展。

因此在学习python的过程中一定要记得多动手写代码，教程只需要看一两遍即可。

👉大厂面试真题👈

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

需要这份系统化学习资料的朋友，可以戳这里无偿获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84688608

关注

7
点赞
踩
26

收藏

觉得还不错? 一键收藏
1
评论
进网页需要验证码？不好意思，Python从来不惧各种验证码！

Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！
复制链接

扫一扫