自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 有道翻译逆向案例

将其打印后会发现一个加密字符串。

2024-09-01 10:08:31 207

原创 js逆向小技巧

数据中(查询数据和form数据),请求头中,cookie中。

2024-08-31 17:46:43 254

原创 RSA加解密

【代码】RSA加解密。

2024-08-28 14:15:27 236

原创 Flask框架

【代码】Flask框架。

2024-08-28 12:49:35 101

原创 python的res加密算法

【代码】python的res加密算法。

2024-08-28 12:49:10 131

原创 Pyppeteer

Pyppeteer是一个比selenium更加高效的一个爬虫模块,是基于python新特性实现的,所以它的一些执行也支持异步操作,效率相对于 Selenium 来说也提高了。

2024-08-19 12:28:56 250

原创 scrapy爬取图片和视频文件

当`FilesPipeline`处理时,它会检测是否有`file_urls`字段,如果有的话,则会对其进行文件下载。​ **`Item`要包含`file_urls`和`files`两个字段**- 下载完成之后,会将结果写入item的另一字段`files`- spider提交item给FilesPipeline管道。

2024-08-18 15:55:08 242

原创 scrapy框架

scrapy是一个用于爬取网站,提取结构性数据的一个半成品框架,里面集成了许多功能。Windows系统:基本使用创建项目创建爬虫文件运行项目编写爬虫文件理解爬虫文件的不同组成部分配置文件修改:settings.py - 不遵从robots协议:ROBOTSTXT_OBEY = False - 指定输出日志的类型:LOG_LEVEL = 'ERROR' - 指定UA:USER_AGENT = 'Mozilla/5.0 (Macintosh; In

2024-08-18 11:57:35 387

原创 使用selenium实现“可见即可得”和“验证码识别”

在上面的实例中,一些交互动作都是针对某个节点执行的。比如,对于输入框,我们就调用它的输入文字和清空文字方法;对于按钮,就调用它的点击方法。其实,还有另外一些操作,它们没有特定的执行对象,比如。,这些动作用另一种方式来执行,那就是。

2024-08-15 18:09:37 131

原创 协程的作用和优点

举个例子:假设我们有从多个网页爬取数据的要求,我们设定多个线程进行去执行获取网页的操作,当其中一个网页阻塞时,可以不必一直等待,会先去执行其它操作。计算机中启动的,你确定每次CPU进行进程/线程,都会切换到网页下载的进程/线程中吗?答案是,因为这个,无法人为干涉。那么,这些网页下载任务的了。因此,可以使用来解决该问题!

2024-08-12 22:43:39 759

原创 并发、并行和同步、异步

广义定义:进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。在操作系统中,每启动一个应用程序其实就是OS开启了一个进程且为进程分类对应的内存/资源,应用程序的执行也就是进程在执行。狭义定义:一个正在运行的应用程序在操作系统中被视为一个进程举个例子:我们有py1文件中和py2文件,两个文件运行起来后是两个进程进程调度。

2024-08-11 12:32:12 705

原创 爬取cookie

现在大多网站如今设有cookie检测,如果没有cookie,有可能请求失败,爬取不到想要的数据。

2024-08-10 15:01:59 207

原创 UA和动态检测

UA检测是网站为了反爬虫所设置的:网站后台会检测请求的载体是不是浏览器,如果是则返回正常数据,不是则返回错误数据。

2024-08-08 15:46:08 420

原创 requests基础操作

requests是一个能够模拟浏览器上网的模块。

2024-08-08 15:32:12 171

原创 什么是cookie?

首先来讲,cookie是浏览器的技术,Cookie具体指的是一段小信息,它是服务器发送出来存储在浏览器上的一组组键值对,可以理解为服务端给客户端的一个小甜点,下次访问服务器时浏览器会自动携带这些键值对,以便服务器提取有用信息。还是那两只鱼,为了解决这个问题,他们用了一种方法储存,现在假设a(客服端),b(服务端),a发出一个请求和一个空cookie,b收到请求和cookie后向a发出响应并把将其中的信息编辑到cookie中也一并返回。

2024-08-06 10:55:18 242

原创 Lambda函数和inline函数

捕获列表](形参) ->返回参数(可以不写){代码块}

2024-03-28 18:34:24 253

原创 多态的代价

因为回收是从派生类开始的,当派生类执行析构函数后已经被回收,此时到基类的析构函数时,因为T2被回收,所以他只能执行T1中虚函数的内容。此时是先执行T的构造函数,因为T2还没创建,所以此时虚构函数依旧是//T的内容,而后是T2的内容,所以打印的顺序是。就会出现析构时只调用T析构函数的内容,则是因为析构函数是非虚的,有内存泄漏的风险,预防此事只需将他变成虚函数即可。基类和派生类是占一块空间,派生类在实例化时,是从上往下,是先实现基类的构造函数,后实现派生类的构造函数,例如。但如果动态分配内存时。

2024-03-15 18:28:05 159 1

原创 c++中的虚函数和STL

STL在我的理解中是c++在c的基础上拓展的一些模版,例如vector,list,栈,堆等等。c++相较于c语言多了三样:一. 构造函数和析构函数原先的C语言不能主动释放内存,而一旦程序过大时,就容易导致运行越来越慢,所以c++创造了构造和析构。二. 访问修饰符原先的C语言内部公开,谁都可以访问,不安全,c++多了public 、prative等等。三.模版函数减少了代码工作量。

2024-03-11 12:44:29 152 1

10.23作业.zip

10.23作业.zip

2023-10-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除