- 博客(56)
- 收藏
- 关注
原创 爬虫学习 Scrapy中间件&代理&UA随机&selenium使用
isinstance() 函数来判断一个对象是否是一个已知的类型,类似 type()。可以使用useragentsring.com设置一个USER_AGENT_LIST。如果要判断两个类型是否相同推荐使用 isinstance()。middlewares只留process_request即可。由于想要替换掉原来的downloader,原中间件无意义。在引擎将请求的信息交给下载器之前,自动的调用该方法。middlewares.py 中间件。
2024-03-13 19:16:17 1123
原创 爬虫学习 自动化测试工具selenium入门
再继续进度已经是2024年了...我尝试了edge chrome 浏览器selenium都有闪退.可能是我过去用过魔改版的问题... 改成火狐没事了(火狐甚至不用看浏览器版本),各位看自己需求来...加密拦截 流量(当然不能完全阻挡) 用json来解密。(小白福音) 人怎么想,怎么做。每次selenium 都需要打开浏览器窗口很麻烦。新标签页selenium 需要调整窗口视角。(不同的浏览器需要不同的驱动)再用selenium执行JS。各种操作(之前写的)B站检测鼠标轨迹..
2024-02-01 18:32:05 229
原创 C语言指针结构体一些问题
在程序中存储一个整数 10,除了使用 int a;这种方式在内存中申请一块区域来存储,还有另外一种。,也是用 来访问结构体内部成员的。因为此处 p 是一个指针,所以不能使用。这里 printf 语句里面*p 中的*号叫做。,作用是取得指针 p 所指向的内存中的 值。上面的代码中我们发现了一个很奇怪的符号“号 访问内部成员,而要 使用->。
2023-12-20 16:58:46 397
原创 SQL 存储过程&触发器
单个SQL语句 实现不了复杂的实际应用,需要一组SQL语句来实现,可编程的函数,完成特定功能编写的SQL语句&控制语句的预编译的集合,再次调用时不再编译。
2023-12-11 14:47:57 602
原创 爬虫学习 逆向爬虫(六)
m3u8 文件实质是一个播放列表(playlist),其可能是一个媒体播放列表(Media Playlist),或者是一个主列表(Master Playlist)。但无论是哪种播放列表,其内部文字使用的都是 utf-8 编码。当 m3u8 文件作为媒体播放列表(Meida Playlist)时,其内部信息记录的是一系列媒体片段资源,顺序播放该片段资源,即可完整展示多媒体资源。#EXTM3U。
2023-11-29 11:46:04 2294 1
原创 【C++】我要学会动态规划--dp问题!!
需要注意的是,C++提供了更安全和类型友好的初始化和赋值方式,如使用构造函数、循环或。应该谨慎,尤其是当处理非字符类型的数组时,以避免类型不匹配或对象构造/析构的问题。一共N个球,假设i个元素有h[i]出球方式 , 第k个小球 算前面的小球。h(n-1)*h(0) ( 看得像。实在看不了我的代码屎山可以看官方(借鉴。参考代码都比我麻烦 --(超时?,就可以求出完整的f数组的值了。顺便复习一下memset。(9个A)在这个例子中,,以确保字符串的终止。大任务 分成 小任务。特别求出马控制的点。
2023-11-20 19:25:00 68
原创 爬虫学习 requests进阶(四)
我们在之前的爬虫中其实已经使用过headers.header为HTTP协议中的请求头.一般存放一些和请求内容无关的数据.有时也会存放一些安全验证信息.比如常见的User-Agent, token,cookie等.通过requests发送的请求,我们可以把请求头信息放在headers中.也可以单独进行存放,最终由requests自动帮我们拼接成完整的http请求头.
2023-11-09 17:53:18 453
原创 【C++】算法竞赛常用 STL 用法
包含一些常用数据结构与算法的模板的 C++ 软件库。其包含四个组件——算法 (Algorithms)、容器 (Containers)、仿函数 (Functors)、迭代器 (Iterators).
2023-11-04 16:15:24 277
原创 爬虫学习 python基础(一)
集合中的元素不会重复,并且可以进行交集、并集、差集等常见的集合操作。反斜杠可以用来转义,使用 r 可以让反斜杠不发生转义。内置的 type() 函数可以用来查询变量所指的对象类型。爬虫 自动化 科学计算 人工智能。语句,但在 Python3.10 版本添加了。无限循环你可以使用 CTRL+C 来中断循环。判断x是否存在于s x in s。集合(set)是一个无序的不重复元素序列。则 \n 会显示,并不是换行。字典是另一种可变容器模型,且。不同之处在于元组的元素。
2023-10-30 17:35:17 77
原创 0 day 学习
PE是 Win32 平台下可执行文件遵守的数据格式。常见的可执行文件(如“*.exe”文件和“*.dll”文件)都是典型的 PE 文件。PE 文件格式把可执行文件分成若干个数据节(section)一可执行文件不只有二进制的机器代码,还会自带许多其他信息,如字符串、菜单、 图标、位图、字体等。规定了在可执行文件中如何组织。典型 节:.text由编译器产生,存放着二进制的机器代码,也是我们反汇编和调试的对象。.data初始化的数据块,如宏定义、全局变量、静态变量等。.idata。
2023-09-26 15:25:28 90
原创 WUT&ACM:语法进阶&STL
void build (int u, inr v =1,r =10000) 函数可赋初始值,赋值在后,后面也必须全赋上初始值。const在前 const int* ref 指针常量 --常量的指针,指向常量的指针。swap(int& a,int& b){} 内交换,外面就交换。--> 无需再打"std::" std::swap();//取消同步流可能会卡在某个地方,无法输出,所以需要刷新缓冲区。的使用方式(c++17后增加了。不是指针,似指针.模拟指针功能.
2023-08-29 22:23:59 59
原创 8.26~8.29刷题随笔
P2670 [NOIP2015 普及组] 扫雷游戏 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)//看的很乱---蒟蒻蒟蒻蒟蒻蒟蒻。
2023-08-26 14:02:09 79
原创 8.22~8.23学习随笔
p111 stat方法。快速排序, 时间复杂度n*log2(n)vector 容器 sort(v.begin(),v.end())#include (STL标准库)#局部变量&全局变量。
2023-08-22 15:56:15 65 1
原创 图解HTTP--Web的攻击技术
简单的 HTTP 协议本身并不存在安全性问题,因此协议本身几乎不会成为攻击的对象。应用 HTTP 协议的服务器和客户端,以及运行在服务器上的 Web 应用等资源才是攻击目标。
2023-07-21 09:33:51 270 1
空空如也
C++ "校门外的树" 刷题出错,想知道问题在哪
2023-07-07
自守数问题,问题详细见帖
2022-09-10
TA创建的收藏夹 TA关注的收藏夹
TA关注的人