自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 收藏
  • 关注

原创 某方protobuf闲谈

当我们去看某方的时候,搜索了关键词svm,然后通过抓包查看,请求的Request Payload是一串看不懂的乱码,并且返回的数据也大部分是乱码。观察请求的Content-Type是application/grpc-web+proto,没错数据的传输是protobuf的形式了。由于是protobuf,我们需要使用google的proto,如果你细心观察的话,目标站也是打包的google的。然后下一步到getRequestMessage这个方法的时候,打一个断点,因为很明显是获取请求的数据嘛。

2024-05-26 14:24:07 67

原创 某勾求职网逆向分析

后续可参考:https://mp.weixin.qq.com/s?请求和返回是一个AES加密,加密的KEY是session storage里面取的aeskey做为秘钥。请求头部的X-K-Header,X-S-Header,X-Ss-Req-Header由如下js得到。请求头部的X-Anit-Forge-Code,X-Anit-Forge-Token由当前页面返回。请求头部的Traceparent由如下js得到。请求和返回都是加密的。请求头部也有未知参数。python模拟请求。

2024-05-20 23:14:27 121

原创 药监局补环境通杀

可以发现是通过Function来执行的debugger,有人就会想,把Function进行hook不就 行了吗(换句话说就是置空)通过跟会陷入死循环,会循环调用这个_$db,慢慢是通过构造器来调用的,这里就不慢慢跟了。你会发现,明明已经永远在这里不停止了,但是为啥还是过不去,并且电脑直接卡爆了,简称。然后全部过调以后,你会发现没有了debugger,但是有个问题是,控制台一直在报错。利用本地替换,将堆栈中的debugger修改为null,或者其他也行。虽然都已经烂大街了,但是很菜的我还是想记录一下。

2024-05-20 23:05:51 168

原创 全量海外众筹Kickstarter

有需要的联系!

2024-05-06 09:46:02 92

原创 某米社区请求data类型multipart_form-data分析

multipart/form-data多用在媒体文件的上传和信息的上传,请求构造中的fields可以是字典也可以是列表包含元组的形式,看自己习惯哪种,及时的掌握此种发包类型,可以让你少走很多弯路!通过抓包查看,请求data类型为multipart/form-data;点击view source就会展示出以【------WebKitFormBoundary9Fxpi3Dvlnhm3MKq】 进行分割的参数。

2024-05-02 15:45:27 360 1

原创 某产业政策数据平台请求data加密分析

是经过混淆的,已经面目全非了,简单在console打印一些信息,可以很明显看见是请求拦截器,意思就是说在请求之前,在这里面可能进行了加密操作,带着怀疑往下分析。通过抓包查看,请求负载是一串乱码的数据,反正是看不懂,应该是字节相关数据。进入encode方法内部,核心生成方法就在这个vm里面生成。那后面主要就是分析这个请求参的加密方式了。从发起程序的请求调用堆栈如下图位置点进去。而返回的数据是正常的json数据。经过分析,加密在如下位置生成的。完事了,又是熬夜的一天。然后把代码扣下来补齐。

2024-05-02 03:54:30 132

原创 某音最新长ab闲谈

然后打上条件断点 s.apply(b, u).length==168,为啥是168,是根据测试了好几遍,长度固定为168得出的,s.apply(b, u)是vmp惯用调用方式。补充:可以根据(0,e._u)(r[0], arguments, r[1], r[2], this)调用出值。当然,你细心可以发现js文件尾部有window.bdms = n,可以根据调试或观察或大佬说的技巧来解决,可以看到,这里就是ab生成的地方了,入参就很明显了。进入s方法内部,打上断点。把代码扣下来,补环境就行。

2024-04-26 21:44:18 308

原创 浏览器打不开DevTools?

当我们通过F12或者Ctrl+Shift+I去打开开发者工具的时候,并不能打开,没有任何反应,这个时候猜测,有可能是触发了快捷键或者功能键,被禁止,然后我们另辟蹊径,又通过右上角->更多工具->开发者工具先打开,然后再粘贴网站,发现几秒之后重定向到空白页面,这个时候猜测可能检测了浏览器宽高啥的,但是我们打开如下图模式,再打开网站,还是重定向到空白窗口,这个时候就 需要通过断点来进行分析。我们可以在 A.ondevtoolopen(this.type, _) 打上断点,然后进行释放,重新开始。

2024-04-25 17:49:56 461

原创 在python中,对encodeURIComponent的使用避坑指南

例如在 URI 中,有一些特殊字符具有特殊的含义,例如 (:,/,?,#) 等,如果 URI 中包含这些特殊字符,并且它们不是作为字符的一部分出现(例如在查询参数中),就需要对它们进行编码,以免与 URI 的语义产生冲突。如何在python中进行使用呢?该字符是保留的,但在典型用法中,quote 函数被调用在保留现有斜杠字符的路径上,这就解释了前面我们举例当中,为啥"/"没有被编码的原因了。你这样编码以后去发请求,肯定是不对的,经过细心观察以后,我们发现【: , [ ]】这四个字符是不会被编码的。

2024-04-25 17:47:58 1085 1

原创 推特数据采集

推特数据采集,包括搜索,转发,引用,点赞,评论,主页,粉丝和关注者

2024-04-05 20:04:30 626

原创 kickstarter数据采集

搜索界面字段如下:详情界面字段如下:评论页面采集:需要的可以找我沟通。

2023-11-16 22:15:08 1005

原创 基于游客时空行为特征研究(两步路)

图片无法展示,具体可参考:https://mp.weixin.qq.com/s?Geopy可以使用测地线距离或大圆距离计算两点之间的测地线距离, 默认的测地线距离可用作函数geopy.distance.distance。经过查看论文研究,很多用户会经常徒步旅行,同时呢会使用两步走app来记录自己的行程轨迹,这样我们可以分析用户的徒步过程的一些状态。下面是测地线距离的示例用法,取对 元组数量:(lat, lon)可以根据用户轨迹相关信息,进行GIS空间分析。1.3 根据经纬度计算距离。

2023-06-19 00:44:44 479

原创 某q音评论获取分析

然后再全局搜索,最终定位到如下位置,打上断点,刷新,可以发现,t.data是payload,o就是我们的签名函数了。再观察总体的特征是一个webpack,以及是大数组,猜想是jsvmp,听大佬说,这个就是jsvmp。rpc方案可以具体参考:https://github.com/jxhczhl/JsRpc。走进去看看,可以看到这里是根据不同的参数进行计算的。本次以周杰伦的歌曲《七里香》为例,采集一下评论。然后打开控制台,进行下拉刷新,就能找到接口。这里采用RPC的方式,最终采集数据。

2023-03-07 23:43:35 184

原创 某书web的X-s逆向

JSON[cr(ae, se) + “fy”](t) : “”][cr(ue, le)](”"))):对第④步进行一些随机字符串的拼接。JSON[cr(ae, se) + “fy”](t) : “”][cr(ue, le)](”“)):将第③步进行md5加密。JSON[cr(ae, se) + “fy”](t) : “”][cr(ue, le)](“”):是将一些参数添加到列表,然后利用"“进行拼接。②JSON[cr(ae, se) + “fy”](t):将t进行序列化。完事,如果有问题请和我沟通交流!

2023-03-04 23:09:00 1617

原创 采集知乎评论

看见有导出,这是webpack,本人比较菜,选择补环境的方式来做,这里把整个方法copy下来,然后看缺什么补什么。看看请求参数,可以看到区别在于offset,这个offset也很简单,是时间戳+上一页最后一条评论拼接的。重头戏在请求头,我们看看,发现有一个x-zse-96参数是不断变化的。我们通过暴力搜索这个参数名,点击去,然后全局搜索,分别打上断点。点进入,发现是一个大数组和控制流,基本判断是jsvmp。这里我们点击最新,抓包看看,可以看到正常抓到我们的包。我们看到,输出的值会变化,确定是动态的。

2023-02-16 13:52:16 396

原创 某yaojianju之自动化方案

这里我就不详细说,这个网站有什么反爬点的,你能看到这篇文章,大致应该了解其反爬措施,很多大佬都是逆向js,怪我自己太菜,选择自动化学习操作。接口:http://scxk.nmpa.gov.cn:81/xk/

2022-08-19 16:43:59 111

原创 某得物数据获取

sk,x-Auth-Token,wxapp-Login-Token都是用户唯一认证,重要的就是sign参数,长度为32位,盲猜一波应该是md5,经过分析js,sign是由请求参数加盐然后再hash一下得到。接口:aHR0cHM6Ly9hcHAuZGV3dS5jb20vYXBpL3YxL2g1L2luZGV4L2ZpcmUvc2hvcHBpbmctdGFi。我们就获取就点到酒饮这个类别。...

2022-08-19 00:12:28 2389 4

原创 qcc之headers逆向

下面我们重点解决第一个参数,那个找不到头尾的参数,像这种,我们就无法通过全局进行搜索了,细心的同学可能会发现,我们在搜索x-pid的时候,都是将值赋值给headers的,如:e.headers[“x-pid”] = window.pid,这就给我们提供了一个思路,我们也可以全局搜索headers[来进行定位。先将t进行charCodeAt等一些列转换得到密钥,然后将t+“{}”,作为加密字符串,然后将加密后的结果进行转小写,取8到20位即可,对于密钥,大家各自走进去调试看看,这里我就不讲了。...

2022-08-14 16:33:50 294

原创 飞猪sign

飞猪sign加盐加密。

2022-08-06 12:24:12 310

原创 获取小猪民宿(短租)数据

通过扣取js,发现是先将接口进行md5加密,作为key,然后将请求参数进行排序和接口拼接,最后通过HmacSHA1加密得到,下面进行测试。总结本篇文章是将数据写入excel文件,当然你也可以写入数据库,通过storeId进行表关联来进行查询数据,以上就是全部内容了。发现和接口返回的gatesign值一模一样,后面就是构造请求了,先测试两页。注关于fiddler配置问题自行百度,网上教程很多。经过对比,如下参数是可变参数,其他可固定。利用fiddler抓包。......

2022-08-01 22:28:22 684

原创 字体反爬之好租(字体反爬通杀方案)

答案是有的,有很多博主采用坐标差值到一定阈值内,就视为同一个字,但本文采用K近邻算法进行训练,预测每个出每个字体,关于K近邻算法,网上有很多教程,这里不做过多赘述。我们接着看请求字体包,我们发现,该font-woff字体文件是经过Base64编码以后的字符串,我们在网页搜索一下woff,正是在网页源码中,这一步,我们可通过获取页面源码得到字体编码字符串。总结当遇到站点字体是动态字体时,我们就不能只考虑固定的字体编码映射,尝试K近邻算法进行训练,预测来达到实时映射的目的!获取前两页,发现我网页的一致。...

2022-07-31 13:22:01 343

原创 获取马蜂窝酒店数据(_sn)

接着我们看看请求参数是哪些,图中框选的为我们需要填的,入住和离开日期可固定,页数可以设定,时间戳可以设定,现在我们看看这个_sn参数是啥。进入到主页以后,我们点击相应的酒店,筛选相应的入住日期和离开时间,点击搜索,通过抓包,找到接口。_ts是时间戳,而_sn是通过请求参数,通过排序,加盐,最后通过md5加密截取2到12位得到。只能通过XHR断点来看了,复制接口到如下图地方,然后点击下一页,然后下一步到ajax的地方。②可能是通过混淆的代码产生,然后在发生请求的时候,调用拼接得到。抓取需求如下图框选部分。..

2022-07-25 18:04:00 305

原创 获取同程(艺龙)酒店数据

到这里很多人看了以后,这不就是有手就行么,然后把请求头和对应的参数拿来,就发起请求,发现数据是重复的,那怎么办呢?我们再点击下一页看看,发现出来一个新的请求,然后对比了两个请求头,发现有一个参数值是动态变化的,没错,就是traceid,每一次都会变化,那怎么办呢?我们点击检索,然后按F12,点击下一页,通过抓包,我们发现是通过JSON格式数据返回的,并且一一对应。打上短点,点击下一页,然后下一步,在控制台输出一下,这不就是我们想要的的么。这里选择①,②,③三个设置,你们如果有其他需求可以相应的勾选。...

2022-07-24 14:40:49 854

原创 爬取面会菜音评评论

参考这篇文章aHR0cHM6Ly96aHVhbmxhbi56aGlodS5jb20vcC81NDI2MTc1OTk=解密网站https//www.bejson.com/enc/base64/大家好,今天我们获取以下《面会菜》这首歌的评论。你们通过在线网站解密以下就可以了。

2022-07-21 09:09:57 65

原创 蝉妈妈主播数据获取

粉丝人数接口aHR0cHM6Ly9hcGktc2VydmljZS5jaGFubWFtYS5jb20vdjEvZG91eWluL2xpdmUvcm9vbS9tdWx0aS9jaGFydA==本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!进入直播场次,点流量分析,本次目标是,获取每场直播的在线人数,进场人数,福袋,讲授商品,以及对应的时间点(按每分钟)获取董先生最新直播7天的数据。...

2022-07-17 12:53:37 1157

原创 同花顺某v参数详解

声明本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!目标站点:aHR0cDovL3EuMTBqcWthLmNvbS5jbi8=通过抓包,查看,在headers中有一个hexin-v,也是Cookie中的v,经过测试,是动态发生变化的这里我们直接hook通过调用栈,在c这里已经生成了继续往上回溯,来到这么一个地方打上断点,单步进入,发现D函数是调用O函数,O函数就在上边O函数

2022-07-14 13:02:16 1921

原创 获取某程酒店数据

声明本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!这个网站的难点在于testab参数通过全局搜索testab点击框选的那个js,在如图位置打算断点,可以发现,testab是e()函数得到,然后通过encodeURIComponent编码得到然后往下拉动,成功断住,点进去,然后发现是经过高度混淆的,文末是一个大数组,是一个经过混淆和平坦流的jsvmp由于此种难度极高,需要

2022-06-05 13:43:54 1505 11

原创 全网最新爬取某团民宿(酒店)数据

声明本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!目标URL:aHR0cHM6Ly9taW5{liangge}zdS5kaWFucGluZy5jb20vYm{liangge}VpamluZy8/ZGF0ZUJlZ2luPTIwMjIwNjA1JmRhdGVFbmQ9MjAyMjA2MDY=目标列表页接口:aHR0cHM6Ly9taW{liangge}5zdS5kaWFucGluZy5jb2

2022-06-05 11:22:50 1352 8

原创 教你如何爬取某哪儿网酒店数据

声明本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!1、目标URL:68747470733A2F2F686F74656C2E71756E61722E636F6D2F636E2F6265696A696E675F636974792F3F66726F6D446174653D323032322D30342D333026746F446174653D323032322D30352D30312663

2022-05-01 13:57:33 2081 7

转载 mysql8.0出现的2059 - authentication plugin ‘caching_sha2_password‘ -navicat连接异常问题解决

刚装了mysql8.0,用navicat登陆不了,会出现2059错误,只能用命令行登陆(每个人可能碰到的问题不一样,我是这样解决的,大家用这个解决不了继续搜索哈)1.找到配置文件my.ini将default_authentication_plugin=caching_sha2_password改为default_authentication_plugin=mysql_native_password2.用命令行登陆mysql -u root -p1234563.use mysql4.ALTER

2021-02-24 20:07:41 126

原创 MySQL的执行顺序

最近看到很多mysql关于执行顺序,⚠️(不是手写顺序)❌:from->on->join->where->group by->having->select->distinc->union->order by->limit√:from->on->join->where->group by->select->having->distinct->union->order by->limit

2021-02-19 20:01:39 98

转载 Excel自动化

Excel自动化1.安装与导入模块`pip install openpyxl`2.读取和处理数据#读取数据import pandas as pddata = pd.read_excel('./data.xlsx')data其中每一列的含义如下:InvoiceNo:发票编号StockCode:产品代码Description:产品名称Quantity:产品数量InvoiceDate:开票时间UnitPrice:产品单价CustomerID:客户编号Country:国家名

2020-11-30 20:08:20 1006

转载 Python中年使用Excel函数

Python中使用Vlookup函数from openpyxl import load_workbookworkbook = load_workbook(‘xxx.xlsx’)sheet = workbook[‘sheet1’]sheet[‘G1’] = ‘名称’for i in range(2,sheet.max_row+1):sheet[f’G{i}’] = f’=VLOOKUP(E{i},$k1:1:1:L$5,2,0)’workbook.save(filename = ‘xxx.xls

2020-11-30 18:30:09 93

原创 Python第三方库下载源配置

配置Python的第三方库下载源pip config set global.index-url https://mirrors.aliyun.com/pypi/simple

2020-11-27 15:35:20 794

原创 JAVA1.8的API

如果各位小伙伴想要Java Platform SE8 的标准的API,可以在评论区留言,我收到后会分享给大家!!!

2020-05-07 14:28:27 132

原创 Apache静态网页的部署

Apache 静态网站的配置一、安装apacheyum直接安装apache[root@TSL5 ~]# yum install httpd -y启动服务,并加入到开机启动[root@TSL5 ~]# systemctl start httpd[root@TSL5 ~]# systemctl enable httpdln -s ‘/usr/lib/systemd/system/http...

2020-03-27 22:13:58 899

原创 LNMP环境搭建

LNMP源码编译LNMP-------->Linux Nginx Mysql PHP​ Nginx (“engine x”) 是一个高性能的 HTTP 和 反向代理 服务器。Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布,因它的稳定性、丰富的功能集、...

2020-03-25 16:59:09 291

原创 Mycat中间件实现负载均衡

mysql/mariadb实现读写分离一、读写分离的概述Mysql作为目前世界上使用最广泛的免费数据库,相信所有从事系统运维的工程师都一定接触过。但在实际的生产环境中,由单台Mysql作为独立的数据库是完全不能满足实际需求的,无论是在安全性,高可用性以及高并发等各个方面。因此,一般来说都是通过 主从复制(Master-Slave)的方式来同步数据,再通过读写分离(MySQL-Proxy/Am...

2020-03-23 14:55:38 414

原创 Tomcat搭建实现jsp连接数据库

Tomcat环境配置及实现jsp通过tomcat连接mysql/mariadb1 什么是Tomcat?2 什么是java3 安装配置Tomcat即其他安装配置1 、什么是Tomcat​ 官方网站:http://tomcat.apache.org/​ Tomcat 是 Apache 软件基金会(Apache Software Foundation)的 Jakarta 项目中的一个...

2020-03-23 14:46:18 1294

原创 NAGIOS监控

Nagios监控服务器运行状态1.常见开源监控的对比和选择cacticacti不是监控工具,他是个依赖于SNMP的数据采集和数据呈现的工具。功能: 数据采集、保存数据[SQL,txt]数据展示(rrdtool绘图)数据分析和报警(很一般)nagios功能: 数据报警(报警功能是Nagios的特色功能)[故障触发,故障恢复都可以依赖分析报警(能自动的识别到关键设备的故障,关联设备不...

2020-03-23 14:31:25 640

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除