- 博客(60)
- 收藏
- 关注
原创 Web逆向的认知
一般来说,浏览器本身已经执行了解密逻辑,我们可以通过分析浏览器端的JS代码找到这些加密和解密的过程,并用爬虫模仿这些逻辑。- 当遇到混淆的代码时,首先需要理解如何处理这些被压缩和混淆的JS代码,常见的混淆方法包括变量名重命名、去除空白和注释、代码压缩等。- 对这些内容的加密不同于简单的数据加密,需要分析如何通过模拟请求头、表单、参数等信息的生成逻辑,使得我们的爬虫能够顺利向服务器发送请求并获得正确的响应。理解如何通过逆向分析加密和解密的过程,以及如何利用这些技术模仿服务器的加密方式,从而实现爬虫的功能。
2025-04-03 10:20:29
1056
原创 爬虫逆向进阶指南
要从零基础掌握逆向技能,特别是针对Web端和APP端的逆向,确实需要系统的学习和不断实践。可以总结为两大块:Web端逆向和APP端逆向,其中每个板块都包含多个重要的知识点。
2025-04-03 10:13:33
2464
原创 请求的响应----状态码分为五大类(爬虫)
状态码是HTTP协议的规范,即便电脑断了网,失败的响应都会有一个状态码。了解了状态码,可以更理智的分析当前响应的状态,快速定位具体问题,以及修改爬虫代码。当然状态码这仅仅是规范中的一项,下节课程还要学习请求头中的重点字段,这也是非常重要的信息。一个爬虫的成功与否,在于你是否拿到了想要的数据;一个请求的成功与否,在于响应的状态码,它标明了当前请求下这个响应的结果,是好还是坏。上节课程学习了HTTPS和HTTP协议的各自优势,本节课程进入到请求的响应部分,学习下如何根据响应状态码,判断当前响应是好还是坏。
2024-10-14 16:12:39
1247
原创 gitee公钥设置、创建库及使用
简介一、如何安装git使用gitee,需要先安装git工具。工具网站地址:https://git-scm.com/downloads安装完成后,在terminal命令行输入可以查看到git的版本。
2024-09-29 09:53:02
663
原创 python-桌面软件自动化(二) (实战 微信自动群发)
本节课学习了控件的其他常用操作,再结合拓展的鼠标,键盘操作,一整套完整的桌面软件自动化的技术都涵盖在内了,相信实战中的微信自动群发会给同学们带来一些启发。本次训练营的周期很长,课程涵盖的内容也非常广,大家学习起来会有疑惑和困顿,这都是正常的。但是不用担心,一个旧的结束代表着一个新的开始,训练营的课程是结束了,但是我们的学习之路才刚刚开始,老师永远欢迎你们!最后祝大家工作顺利,万事如意,财源滚滚!
2024-09-19 15:18:35
581
原创 python-桌面软件自动化(二) (pywinauto模拟鼠标键盘)
capture_as_image() 方法 返回的其实是控件的 PlLimage对象,所以可用该方法的属性方法,比如save()可以图像保存到磁盘。ctrl.release_mouse_input(coords = (None, None)) # 指定坐标释放左键,不传坐标默认左上角。ctrl.press_mouse_input(coords = (None, None)) # 指定坐标按下左键,不传坐标默认左上角。
2024-09-19 11:40:15
1978
原创 python-桌面软件自动化(一)(实战微信发消息)
本节课程我们学习了inspect工具的使用,pywinauto操作控件的完整步骤。只要熟练掌握实例对象,选择窗口,定位控件,以及操作控件的相关方法,我们就已经可以开始编写一些软件自动化功能了。任何复杂的操作其实都可以化繁为简的,掌握基础,多写多练,相信同学们都能写出自己想要的功能的。
2024-09-13 23:28:25
2638
1
原创 python-游戏自动化(三)(实战-豆腐女孩)
虽然这个游戏的玩法比较简单,但是要拿到特别高的分数还是不容易的。在本教程中,霸夫老师也只是以启发大家为目标,教大家去分析如何写出一个自动化游戏教程,程序功能虽然比较简单,但其中涉及的思路分析,图像处理,数据计算、算法优化、设计模式等是很值得大家去细细学习体会的。
2024-09-12 01:34:20
884
原创 python-游戏自动化(二)(OpenCV图像运用基础)
图像二值化可以简单理解成,就是把图像转换成黑白两种颜色(一般用于提取图像特征),二值化图像:只有两种颜色,黑和白,255白色,0黑色。结合前面学习的彩色图像和灰度图像,一起来做个对比。彩色图像:三个通道0-255,0-255,0-255,所以可以有2^24位空间灰度图像:一个通道0-255,所以有256种颜色二值图像:只有两种颜色,黑和白,255白色,0黑色图像匹配,就是从一个图像中找出想要的小图像,打个比方:就好比拿着老师的头像寸照,然后去师的大学毕业照里面一个个的头像对照然后将老师找出来。
2024-09-11 11:42:24
1749
原创 python-游戏自动化(一)(实战-自动刷视频点赞)
pywin32是一个第三方模块库,主要的作用是方便python开发者快速调用windows API的一个模块库。同时pywin32也是绝大部分windows上第三方python模块库的前提,例如wmi,如果没有安装pywin32是无法正常使用wmi这个三方模块库的。这里我们要先说下句柄的概念,通俗点说句柄就是窗口的身份证号,是一串整数。举个栗子,你有你自己的身份证号,一报身份证号,你应该知道是你了。你也有名字,但是大家都知道名字并不是唯一的,你可以叫张三,别人也可以叫张三,而且没有数字来得方便。
2024-09-10 00:12:11
1699
原创 网页解析 lxml 库--实战
本节课我们又学习了爬虫的一个新的网页解析库lxml,从网页中快速解析出想要的目标元素,熟练掌握解析库的使用技巧是必须的基础,爬虫的范围非常的广,爬虫的入门门槛很低,但是要修炼到更高的阶段,道路可不平坦,课程所限不能将爬虫的知识展开细讲,同学们有需要可以在拉拉老师的星球里和老师一起来研讨如何写出自己想要的爬虫。
2024-09-09 11:40:30
1933
原创 python爬虫--实用又便捷的第三方模块--requests实战
本节课是爬虫课程的第三节课,我们在学习了正则表达式和爬虫基础知识后,开始学习Python爬虫的第三方优秀库,本节课主要学习了网络请求 requests 库,和网页解析库 BeautifulSoup 库(BS4),这些库在封装了很多基础的方法,使用方便快捷,功能强大,熟练掌握了这些库,在以后编写爬虫时会有事半功倍的效果。
2024-09-08 22:15:11
1933
1
原创 爬虫基础知识+豆瓣电影实战
简单来说,爬虫就是获取网页并提取和保存信息的自动化程序,爬虫能够自动请求网页,并将所需要的数据抓取下来。通过对抓取的数据进行处理,从而提取出有价值的信息进行存储使用。为什么用Python做爬虫首先您应该明确,不止 Python 这一种语言可以做爬虫,诸如 Java、C/C++、PHP 都可以用来写爬虫程序,但是相比较而言 Python 做爬虫是最简单的。下面对它们的优劣势做简单对比:Java 也经常用来写爬虫程序,但是 Java 语言本身很笨重,代码量很大,因此它对于初学者而言,入门的门槛较高。
2024-09-07 22:50:51
1706
原创 word中怎么快速选中光标之前或之后的全部内容?
8.使用“扩展”模式(首先按下F8键激活此模式,这时屏幕底部状态栏的“扩展”高亮显示,要选定时,连续四次按动F8键即可)。1.按下“绘图”工具栏中的“选择图形对象”按钮,拖出一矩形选定框包围图形对象,即可全部选定;2.使用“扩展”模式(用F8激活“扩展”模式后,使用方向键→←↑↓)。4.若光标处于文首,按“Shift+Ctrl+Home”;5.若光标处于文末,按“Shift+Ctrl+End”;2.按下“Shift”键,在图形上单击鼠标。1.确定“编辑”菜单中的“全选”;1.鼠标在自然段前的选择条内拖曳;
2024-09-06 17:27:06
3287
原创 认识正则表达式
正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。对于爬虫来说,有了正则表达式,再从 HTML 里提取想要的信息就非常方便了。给定一个正则表达式和目标字符串,我们可以达到如下的目的:目标字符串是否符合正则表达式的过滤逻辑(“匹配”);通过正则表达式,从目标字符串中获取我们想要的特定部分(“过滤”)。
2024-09-05 23:44:07
1222
原创 cookie实战案例-自动登录网站
在写爬虫的时候,要伪装成真实用户请求。可能需要大量的IP地址,那么大量的IP地址从哪里来呢?这里就需要用代理IP来解决了,有的网站专门通过提供代理IP池服务作为主要的经营业务,只要注册相关网站开通对应套餐就可以了。账号我已经实现注册好了,可以用代码中的测试账号,也可以自己手动注册一个。
2024-09-05 20:12:58
522
原创 python-网页自动化(三)
如果遇到使用 ajax 加载的网页,页面元素可能不是同时加载出来的,这个时候尝试在 get 方法执行完成时获取网页源代码可能并非浏览器完全加载完成的页面。所以,这种情况下需要设置延时等待一定时间,确保全部节点都加载出来。那么,有三种方式可以选择:强制等待、隐式等待和显式等待。
2024-09-05 20:03:41
1721
原创 python-网页自动化(二)
本节课学习了获取元素属性,多窗口切换,页面交互操作和模拟鼠标、键盘操作这些基本的功能,为每一个功能都编写了一个案例,先模仿再修改,多写多练,加深记忆。t=N7T8菜鸟教程在线编辑器https://www.runoob.com/try/try.php?
2024-09-05 19:21:56
1437
原创 python-网页自动化(一)
Selenium可以说是网络爬虫中的王者了,它可以控制浏览器,当使用 Selenium 当爬虫工具时,网络服务器会认为来读取数据的是正常的浏览器,所以不会有阻挡无法读取网页 HTML 原始文件的问题。当然,Selenium作为爬虫王者,不仅是可以打开网页,读取信息,还可以用它点击链接,填写登录信息,甚至可以做自动上下架商品、抢票抢茅台系统。
2024-09-04 08:52:16
2054
原创 如何彻底关闭Chrome浏览器自动更新
弹出 `你当前无权访问该文件夹 ,证明我们已经配置成功。【此时 谷歌浏览器 自动更新 将没有权限 访问更新文件夹】选择 Update 目录 右键 选择属性 右键 选择属性。4.点击禁用继承!2.选择Google 目录。3.继续 第(2)步 选择。浏览器的图片,鼠标右键。1.首先找到桌面 中。
2024-09-03 09:14:41
789
原创 旧版本google chrome下载地址-and-Chocolatey | Windows 最强大且好用的软件安装工具-and-下载对应版本的chromedriver
记录几个旧版本google chrome下载地址,自动化和兼容性测试可能会用到在浏览器搜索栏中输入命令:chrome://version/
2024-09-02 15:45:11
1821
原创 python-实战4拆分pdf文件
Pdf文件在办公文件中占有很大一席之地,熟悉了pdfplumbe库一些常用操作可以让你轻松获取pdf文件中的内容,不用再一次次去选中文件中的文字进行复制,PyPDF2库可以让你自己实现很多付费软件才能实现的功能。Wps等软件拆分一份页数较多的PDF文件时,经常会出现要收费或者只能拆分其中几页的情况,下面我们就自己来写代码来实现这个收费功能。学习二字,多学多习,希望同学们有空时将本节课中学习的代码都抽离成一个个函数,以后用时直接调用,既省时又省力了。
2024-09-02 09:33:49
810
原创 python-pdf文件加密和解密
如果你需要对多个 PDF 文件进行加密,可以修改之前的代码,使用循环遍历文件列表来加密每个文件。执行完成后,加密后,pdf打开则需要输入密码才能打开多个文件进行加密。
2024-09-02 09:00:54
1004
原创 python自动化操作PDF,拆分pdf合并pdf,提取pdf内容
Python 操作 PDF 会用到两个库,分别是:PyPDF2 和 pdfplumber。PyPDF2 可以更好的读取、写入、分割、合并PDF文件;pdfplumber 可以更好的读取 PDF 文件中内容和提取 PDF 中的表格,主要应用于机器生成的 PDF,而非扫描的PDF文档。由于这两个库都不是 Python 的标准库,所以在使用之前都需要单独安装,在终端中依次输入如下命令进行安装:安装完成后显示 success 则表示安装成功。
2024-09-01 19:01:46
1079
原创 python实战三-提取Word数据到Excel
一个文件夹下有大量会议通知文件,为word文件,文件格式都是一致的,现在要将文件中的一些字段提取出来汇总到Excel文件中。要提取学习时间、学习内容、学习形式、主持人汇总到 会议汇总.xlsx 中,每新增一条记录序号加1。定于3月1日组织公司党委理论学习中心组2021年第一次学习会,现将有。1.学习资料提前发给与会人员,请与会人员做好学习及发言准备;2.请与会人员妥善安排工作,准时参加,学习时间如有变。一、学习时间:2021年3月10日下午4:00.二、学习地点:5楼会议室,五、学习形式:集中学习。
2024-08-31 19:59:30
773
原创 python-读取word中的内容
print(单元格.text)#读取指定段落中的所有run(文字块)#读取word中所有表格内容。#读取word中所有内容。
2024-08-30 17:05:27
1291
原创 python-word添加标题,段落,文字块
代码很简单,首先导入docx库,这里需要注意一点,虽然我们安装的是python-docx模块,但是使用时是导入的docx,从代码中第一行可以看出。level等级1-9 也就是标题1-标题9,我们可以在旧文档中将标题格式设置好,使用Python-docx打开旧文档,再添加相应等级标题即可。document.add_paragraph('以观其妙,', style='Intense Quote')p.add_run('无名,天地之始,').bold = True # 在指定段落后添加粗体文字。
2024-08-30 16:24:31
2160
原创 python设置Excel表格样式与单元格属性
ft = Font("宋体", size=12, color=colors.BLUE, bold=True) # italic=True斜体。PatternFill(fill_type=填充样式,start_color=开始颜色, end_color=结束颜色):Font(name=字体名称,size=字体大小,bold=是否加粗,italic=是否斜体,color=字体颜色)Border(left=左边线样式,right=右边线样式,top=上边线样式,bottom=下边线样式)
2024-08-30 11:09:35
1009
原创 python实战二-筛选多个Excel中数据
sheet[]跟sheet.iter_rows()方法是读取表格数据的重点方法,append()方法则是能将获得的数据快速。插入到excel, 这几个方法都是操作excel极为常用的方法。自动化操作Excel是自动化办公的重要组成部分。这节课我们学了通过openpyxl打开、新建、读取、修。链接:https://pan.quark.cn/s/24656f39210f。筛选12个月中单日销售额大于300的数据,并将符合条件数据存储到新表中。到相应的需求时都能化繁为简,快速得到自己想要的结果。
2024-08-29 23:08:33
1051
原创 python实战一:合并多个Excel中数据
代码很简单,首先使用os库,循环遍历D:\2021年销售明细 目录下所有文件,然后再使用openpyxl库循环遍历单元格中的数据,并且导入,合并结果保存到【全年数据,xsx】文档下。并4个工作簿,共计12张表,使用Ctrl+C、Ctrl+V功能已经不能很好的解决这里的问题,这里我们就可以用。每一个季度销售数据里又包含三个月的具体明细,每个月的销售记录都有1000多条,现在需要批量合。我们打开看下【全年数据.xlsx】可以看到行数计数是跟代码统计的行数相吻合的。以上是我演示有什么不懂的地方可以私信我!
2024-08-28 17:22:40
1437
原创 软考攻略/软考详解/软考等级/软考科目
2022年上半年软考报名已经开始,由于本人以及通过了中级职称中的软件设计师考试,准备报考高级职称,软考备考和学习过程中我本人经历了很多的坑,同时也积攒了很多相关的经验。这也是我为什么会和大家分享这篇文章的原因,给大家科普一下什么是软考,以及软考初级职称推荐报考方向。软考全称“计算机技术与软件专业技术资格(水平)考试”,由国家人力资源和社会保障部、工业和信息化部领导下的国家级考试,设置了 27 个资格包括初级、中级、高级三个级别。
2024-03-10 09:57:32
8727
8
原创 ensp路由启动失败41错误及ensp安装【附安装包】(亲测!!!)
eNSP安装教程(非常详细)从零基础入门到精通,看完这一篇就够了【附安装包】_ensp下载安装教程-CSDN博客.pdf」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。链接:https://pan.quark.cn/s/87e06881e970。
2024-03-04 15:07:55
636
C语言教程&案例&相关项目资源、C语言教程&案例&相关项目资源
2024-02-19
情人节主题爱心代码、情人节主题爱心代码
2024-02-19
2024跨年烟花代码,用Python送自己一场浪漫烟花秀
2024-02-19
资料-MySQL数据库、视频-MySQL数据库
2024-02-19
Kali Linux渗透测试技术详解
2024-02-19
Python编程(思维导图)
2024-02-19
无涯-20230604-社会工程学
2024-02-19
网络安全现状及报告书呀
2024-02-19
网络安全面试类题目-详解
2024-02-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人