Python--数据收集
文章平均质量分 86
以Python爬虫为主(深入app逆向)。
秋刀鱼_(:з」∠)_别急
cash rules everything around me
展开
-
今日头条-实战爬虫
通过该案例记录一种逆向思路:通过后端node+js代码实现伪造浏览器环境后,用Python调用js代码生成请求参数。原创 2023-12-10 20:36:34 · 2075 阅读 · 0 评论 -
超级简单的暴力枚举法-破解压缩包密码-python
准备工作:import os。原创 2023-12-10 20:36:14 · 556 阅读 · 0 评论 -
视频播放量的变化逻辑
以此文记录爬虫逆向学习思路代理ip+cookie来刷播放缺陷:据说破站这方面的检测很严格了,这种刷播放的方式,不会真的观看视频,就是点播一下,如果很多播放量都是这种点播而且还都是游客播放b站是能检测到的,检测到就刷了也没用播放量也不会涨的。原创 2023-12-10 20:35:49 · 1041 阅读 · 0 评论 -
JS逆向之网易云音乐&Python爬虫之网易云音乐爬取
缺点:不能够爬会员歌曲网易云音乐网页的源代码里没有下载歌曲的url,开发者工具里也无法在浏览器渲染后的页面代码里找到,所以–进行抓包。抓包发现目标。访问一下url。原创 2023-12-10 20:35:23 · 1390 阅读 · 0 评论 -
Python-自制简易音乐播放器
原理简单:通过外链和歌曲Id拼接成下载链接来下载歌单中的歌曲。缺点:这个外链可能会失效,而且不能用这个外链来下载会员歌曲,而且这个外链怎么来的未知。原创 2023-12-10 20:35:05 · 1020 阅读 · 0 评论 -
网络爬虫js逆向解决网站登录RSA加密问题+session维护登录状态(cookie-响应头)请求爬取+手动添加cookie(js中)
因为session中一直维护的是响应头中的cookie,Js代码中生成的cookie它是需要手动添加的,缺失了这部分cookie可能就会导致访问登录后才能访问的网页时又要求你进行登录(跳转到登录页的请求返回登录页信息)观察分析ajax请求中的大部分参数由e来给定,且在打上断点后运行第一次中断时,观察到e中url的值为/common/getTime,ajax中url的值即为:/apis/common/getTime。可以判断释放断点后发送了登录的请求,因为使用了对应的参数,原创 2023-12-10 20:34:07 · 1231 阅读 · 0 评论 -
Python爬虫实战之爬淘宝商品--selenium+Xpath
代码链接利用selenium来自动翻页爬取淘宝商品的标题,价格,销量,产地信息。注意自己配置好python环境(谷歌驱动…)jgs = []fkrss = []cdds = []main()data = {'标题': titles, '客单价': jgs, '销量': fkrss, '产地': cdds}df.to_excel('FL销售.xlsx', index=False)原创 2023-11-19 15:03:56 · 3483 阅读 · 1 评论 -
爬虫scrapy-将某网站内的试题爬取出来并保存为本地markdown文件
本文用于参考学习,请执行配置好scrapy环境后再进行编程实操代码。原创 2023-11-16 00:20:05 · 1977 阅读 · 4 评论 -
评论区回赞--python
适用需求:给自己的视频评论区回赞,包括折叠评论。原创 2023-11-15 20:26:38 · 58 阅读 · 0 评论