自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 问答 (1)
  • 收藏
  • 关注

原创 今日头条-实战爬虫

通过该案例记录一种逆向思路:通过后端node+js代码实现伪造浏览器环境后,用Python调用js代码生成请求参数。

2023-12-10 20:36:34 1968

原创 超级简单的暴力枚举法-破解压缩包密码-python

准备工作:import os。

2023-12-10 20:36:14 535

原创 视频播放量的变化逻辑

以此文记录爬虫逆向学习思路代理ip+cookie来刷播放缺陷:据说破站这方面的检测很严格了,这种刷播放的方式,不会真的观看视频,就是点播一下,如果很多播放量都是这种点播而且还都是游客播放b站是能检测到的,检测到就刷了也没用播放量也不会涨的。

2023-12-10 20:35:49 1034

原创 JS逆向之网易云音乐&Python爬虫之网易云音乐爬取

缺点:不能够爬会员歌曲网易云音乐网页的源代码里没有下载歌曲的url,开发者工具里也无法在浏览器渲染后的页面代码里找到,所以–进行抓包。抓包发现目标。访问一下url。

2023-12-10 20:35:23 1363

原创 Python-自制简易音乐播放器

原理简单:通过外链和歌曲Id拼接成下载链接来下载歌单中的歌曲。缺点:这个外链可能会失效,而且不能用这个外链来下载会员歌曲,而且这个外链怎么来的未知。

2023-12-10 20:35:05 933

原创 acm刷题踩坑记录和经验

另外,使用 calloc() 函数时需要注意,如果分配的内存块过大,可能会导致内存不足的问题。long long :-9223372036854775808~+9223372036854775807 (数据位数:19位)//踩过这个坑,因为它能将分配的内存初始化为0!使用new和malloc不会初始化内存为0!double:-1.7×10^(-308) ~+1.7x10^(+308) (16位有效数字)float:-3.4× 10^(-38) ~+3.4× 10^(+38) (7位有效数字)

2023-12-10 20:34:31 1285

原创 网络爬虫js逆向解决网站登录RSA加密问题+session维护登录状态(cookie-响应头)请求爬取+手动添加cookie(js中)

因为session中一直维护的是响应头中的cookie,Js代码中生成的cookie它是需要手动添加的,缺失了这部分cookie可能就会导致访问登录后才能访问的网页时又要求你进行登录(跳转到登录页的请求返回登录页信息)观察分析ajax请求中的大部分参数由e来给定,且在打上断点后运行第一次中断时,观察到e中url的值为/common/getTime,ajax中url的值即为:/apis/common/getTime。可以判断释放断点后发送了登录的请求,因为使用了对应的参数,

2023-12-10 20:34:07 1212

原创 Python爬虫实战之爬淘宝商品--selenium+Xpath

代码链接利用selenium来自动翻页爬取淘宝商品的标题,价格,销量,产地信息。注意自己配置好python环境(谷歌驱动…)jgs = []fkrss = []cdds = []main()data = {'标题': titles, '客单价': jgs, '销量': fkrss, '产地': cdds}df.to_excel('FL销售.xlsx', index=False)

2023-11-19 15:03:56 3358 1

原创 爬虫scrapy-将某网站内的试题爬取出来并保存为本地markdown文件

本文用于参考学习,请执行配置好scrapy环境后再进行编程实操代码。

2023-11-16 00:20:05 1795 4

原创 评论区回赞--python

适用需求:给自己的视频评论区回赞,包括折叠评论。

2023-11-15 20:26:38 55

原创 FreeIP池搭建

用来采集IP的网址免费IP的是最拉跨的,要买的话推荐是买它家的隧道代理。

2023-11-12 21:59:34 795 1

原创 1192 : Big Matrix-HNCPC-18届

规律很简单

2023-07-12 23:53:36 212 1

原创 E. 最短的名字-湖南省第八届大学生计算机程序设计竞赛试题-字典树

从该节点(最多)分支出n个字符串(这个节点被这n个字符串共用了),此时sum的值就要加n,因为这n个字符串的前缀名都必需要用这个字母一次.然后从该节点往下遍历下一层节点,如果又遇到一个节点count值为2的那么sum加2,理由同上文一致。从head指向的第一层(a-z)开始遍历每个节点(也就是每个字符串的开头)如果遇到count值不为0的节点(补充一个点:图中没写数字的节点count值就为0,表示这个字符未被使用过)判断该节点的count值为1还是大于1,如果为1表示该字母是。

2023-07-05 11:44:57 107 1

原创 A - 2018(湖南省第十四届大学生计算机程序设计竞赛)-动态规划

n,m的范围都在[1,2000]内,根据题目的样例看出不取模的数据结果可能还挺大的,要注意溢出的问题,使用表示范围较大的数据类型.ans[i,j]=dp[i,j]*dp[i,j]%mod (取模是题目要求,ans为答案)题目意思就是让你求出能满足条件且矩阵规格固定的矩阵数目.

2023-07-04 08:58:51 97

原创 c++/int a[]{}是什么意思?

int a[101]{}” 是 C++ 中定义一个整型数组的语法。它的意思是创建一个包含 101 个整数的数组,其中的每个元素都会被初始化为 0。这个语法是在 C++11 中引入的,可用于初始化数组元素。在这种情况下,编译器会自动将数组元素初始化为默认值,即对于整型数组,初始化为 0。如果省略 “{}”,则数组的元素将不会被初始化,而是保留为随机值。因此,使用 “{}” 初始化数组可以确保所有元素都有一个明确定义的初始值。

2023-06-22 22:16:35 863

原创 Trie树/并查集

路径压缩:每次查询find(x),就把自己的父亲fa[x]维护成最新查询到的find(fa[x]),集合(树)当前这条链的最大深度就为2,能极大节省时间。AcWing 835. Trie字符串统计。AcWing 836. 合并集合。N为单个字符串最大长度;

2023-05-29 21:21:47 49

原创 静态栈/队列/链表/单调队列(滑动窗口)/单调栈

使用指针+结构体的方式动态实现栈、链表等数据结构时都需要new Node;容易因此(new Node)TLE,处于效率考虑,刷题时一般不采用这种动态的方式。虽然可以通过直接初始化n个Node进行改进,但是那种方式本质就和数组模拟差不多。

2023-05-28 14:30:23 81

原创 前缀+差分+离散化+区间合并(C/C++)

借用一道例题来深度了解:分析一下就可以发现:在这个无限长的数轴中进行n次插入值,n最大为10^5.进行m次询问,每次询问有两个边界[L,R],L

2023-05-23 22:12:45 285 2

原创 排序(快排和归并排序) AND 二分法

原理与基本步骤在一组数中选取一个基准数,以这个数为基准把小于等于和大于等于它的数分为大小两组,然后对这大小两组进行同样的操作,又选取基准数进行分组,直到一组只有一个数为止;在这个过程中数据就会被有序(从小到大)的排好;注意一个点:被分成的两组数据中都可能有等于基准数的数,在小于组中该基准数是最大值,在大于组中这些基准数是最小值;那么经过递归对小组们排序后相同的基准数便被排到了一起;还有一件事写递归就必须要有递归结束的条件,这是最先要想好的事情;基本步骤:选取基准数→ 分组 → 利用递归来再分组借鉴

2023-05-06 22:15:30 153 4

原创 竞赛--C++速成

cout输出小数(fixed:保存;setprecision:精度;right:右对齐)TLE:Time Limit Exceeded(超时);memset:将a数组中的值。

2023-04-30 20:53:50 240 1

原创 JS-实现图片无限自动轮播与点击无限轮播

简单带过一下html结构:主体结构:div(.center)>ul>li>ol>li;" >

2023-02-27 22:51:45 684 2

原创 动态轮播图制作

例如:项目场景:网页的轮播图动态效果制作。

2023-01-21 11:18:58 96

原创 Javascript基础

html:网页元素;css:网页元素的属性介绍;Javascript:网页元素的功能介绍;var alertvalue="网络异常";/变量定义/var alertvalue="正在重新连接";/变量重新赋值/ecmascript:JS的编译标准;undefined:没被定义的var 变量;Boolean:布尔值也就是真假值;Object:对象是拥有属性和方法的数据。(函数也可以作为数据类型----引用类型)可以使用typeof()来检测数据类型;

2023-01-02 19:49:49 156

原创 html5+css3---元素样式+选择器

html5,css3是html,css的迭代产物,相较以前的html和css,迭代产生的区别简单来说就是标签,功能样式都变得更加丰富;其中html5的产生对互联网行业的影响尤为重大,由于它在ios和Android系统上的兼容性都很好,所以现在经常借助它开发在两种系统上都通用的软件;

2022-12-11 20:51:44 182

原创 HTML+CSS--基础学习

前端有三宝:html,css,javascript;我对html+css的基础学习主要是学习常用html标签和常用css样式及一些样式规则;标签大体构成了我们网页的主要元素;样式对标签的属性调节让我们的网页看起来井井有条,看起来舒服;如果说html是创造了一个网页上的物体,那么css标签可以说就是这个物体的一个形容词,来形容这个物体的形状、颜色、大小、位置种种特征;提示:以下是本篇文章正文内容,下面案例可供参考。

2022-11-23 22:37:58 399 1

原创 递归-汉诺塔递归代码解读示例-n=3

假设你已经懂了汉诺塔的规则。#include <stdio.h>void move(char a,char c,int n);void hannuota(int n,char a,char b,char c);int main(){int n;scanf("%d",&n);char a='a',b='b',c='c';hannuota(n,a,b,c);return 0;}void move(char a,char c,int n){printf("第%

2022-11-18 00:16:32 171

原创 C语言常犯错误

明明代码就是这么写的怎么会输出一个不是我想要的值呢?小王是一个有志儿童,电棍也是一个有志教师。一天,小王问电棍,我今天要用c语言输入3,4,5这几个整数然后输出3.000000,4.000000,5.000000,明明代码没问题,编译器没报错,为啥就是得不到想要的结果呢?答没有进行数据类型转换,函数的错误使用。定义的是int类型的三个整数a,b,c使用scanf进行赋值,经常就有人在这时候犯错,什么少了&,该用%d的时候用%f,该用%s的时候用%c.输入的时候,你的scanf是这

2022-10-14 01:11:29 258

播放量增加逻辑供学习交流.zip

提供的代码是一个Python脚本,使用requests库对平台进行HTTP请求。脚本执行以下任务: 导入必要的库(re、requests、time、math、random、uuid、json)。 定义一个get_tunnel_proxies()函数来配置代理设置(代理设置当前未实现,需要手动配置)。 定义一个b_lsid()函数来生成b_lsid值。 定义一个gen_uuid()函数来生成随机的uuid值。 定义一个b_4()函数来从API中获取b_4值。 定义一个fqq()函数,向 API发送POST请求,模拟用户交互(点击视频)。 定义一个get_video_id_info()函数,获取视频的信息(aid、bvid、cid、时长和播放量)。 脚本使用requests库初始化一个会话,设置会话头部,并设置视频URL、aid、bvid和cid。 脚本生成随机的uuid和b_lsid,设置cookies,并从API中获取sid值。 脚本进入循环,在循环中每3秒钟调用get_video_id_info()和fqq

2023-12-10

头条新闻爬虫供学习交流.zip

这段代码使用了requests库发送HTTP请求,并使用execjs库执行了一个JavaScript代码。它的主要功能是获取今日头条的新闻列表数据。 代码中的主要步骤包括: 导入requests、execjs和os模块。 打开一个名为index.js的文件,将文件内容读取为JavaScript代码字符串。 使用execjs.compile编译JavaScript代码字符串为可执行的JavaScript代码对象。 指定要请求的URL地址。 调用之前编译的JavaScript代码对象的get_sign函数,并传入URL参数来获取URL的签名。

2023-12-10

舟山市公共资源交易服务平台 结果公告.csv

将近1000条数据,内含招标项目名,项目金额,公布时间,中标单位公司,代表人名

2023-12-09

在中国石油官网收集的原油现货价格数据 1999-7-7到2023-12-7 WTI,布伦特,迪拜,阿曼,塔皮斯等国家数据

需要更多实时数据可关注私信博主 该文件数据共计6千多条 数据来源: https://www.cnpc.com.cn/cnpcstockinfohtml/oilgas/scgc_crudeoil_more.html

2023-12-09

淘宝FL销售店铺的基本数据(产地+价格+销量+标题)

淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)淘宝FL销售店铺的基本数据(产地+价格+销量+标题)

2023-11-19

爬虫爬取taobao搜索页商品基本数据(可翻页)+ selenium + Xpath (爬虫具有时效性)

利用selenium来自动翻页爬取淘宝商品的标题,价格,销量,产地信息。 利用selenium,手动登录获取cookie保存在本地用于登录平台(便于测试代码),访问商品页url通过Xpath选中对象拿数据,翻页,通过Xpath选中对象拿数据,翻页,通过Xpath选中对象拿数据....*** **网页源代码中是没有所需数据的。** 在淘宝的关键词搜索页进行页面切换,可以发现浏览器顶部的地址栏url也是没有任何变化,那么就抓包吧,通过开发者工具进行抓包发现所需数据都放在一个js请求的响应中。 在Headers中观察请求发现数据请求地址(get请求),但是地址中有加密参数要破解,作者暂时还搞不定,不过b站有教哈。(加密参数:sign,t。(作者感觉这个t应该就是时间哈)) 所以我用selenium,因为成功了.... **注意:** **使用selenium时,在搜索后的商品页中需要下拉滚动页面到底部才能获取当前页所有的商品基本展示信息。** 原理猜测:商品页中商品展示使用Ajax动态请求,为了可以在不重载网页的条件下,与服务器进行数据交互,更新页面的局部数据。***(因为使用A

2023-11-19

网络赛道题目整理资料整理资料

网络赛道题目

2023-11-16

python(scrapy)实战练习基本功 爬取网站的题库存为markdown文件 按类存好

不错的实战项目,适合来练习爬虫(scrapy使用)和数据处理,能搞定一个网站的题库(含图片)

2023-11-15

python-b站评论区点赞

用selenium实现的,登录一次后,可输入多个视频网址的视频下评论区所有评论点赞。 tip:使用前自行配置好python 环境,及时进行浏览器驱动更新哈。

2023-11-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除