quanmoupy
码龄6年
关注
提问 私信
  • 博客:59,413
    59,413
    总访问量
  • 59
    原创
  • 798,586
    排名
  • 108
    粉丝

个人简介:热爱编程,忠于分享。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:贵州省
  • 加入CSDN时间: 2018-11-22
博客简介:

weixin_43770993的博客

查看详细资料
个人成就
  • 获得41次点赞
  • 内容获得3次评论
  • 获得141次收藏
  • 代码片获得686次分享
创作历程
  • 59篇
    2023年
成就勋章
TA的专栏
  • Python爬虫实战案例
    7篇
  • 猿人学竞赛题
    7篇
  • 0基础学Python
    23篇
  • python爬虫从0到1(适合初学者)
    18篇
兴趣领域 设置
  • Python
    pythondjangoflask
  • 后端
    sql爬虫
  • 人工智能
    opencv
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

355人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

数据可视化篇——pyecharts模块

ECharts 官方网站 : https://echarts.apache.org/zh/index.htmlECharts 是 百度 提供的 基于 JavaScript 的开源可视化库 , 可以借助该 函数库 绘制 精美的 图表;ECharts 支持多种图表类型 , 包括折线图、柱状图、散点图、饼图、雷达图、地图等 , 并且可以根据需求进行自定义配置;它还支持动态数据更新、交互操作、动画效果等功能,可以让用户更加直观地理解和分析数据。
原创
发布博客 2023.11.01 ·
1028 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

JS逆向基础之反调试

平时在调试js代码时,经常会出现浏览器卡死的情况,有时候是在调试js的过程中,有时候是在console中调试代码的过程中,有时候是在格式化代码之后,甚至有时候在打开开发者工具之后直接卡崩溃。此处看到的是一个非常简单的例子,在实际的逆向过程中,代码可能是有成百上千乃至上万行,所以调用的函数与实际定义的函数可能会有很大的差别。可以看到,混淆后的代码有很多的$符号,可读性几乎是没有的,所以这种代码是必须去还原之后才能够进行逆向,一般可以通过一些解码工具进行解码,当然也可以将其复制到控制台中运行。
原创
发布博客 2023.10.30 ·
2511 阅读 ·
2 点赞 ·
0 评论 ·
15 收藏

Python爬虫实战案例——第七例

首先对于浏览器来说,需要播放视频的时候,那么浏览器肯定是要对视频地址请求的,那请求的时候这个视频的播放地址必然在请求前已经是拿到了浏览器中,所以,播放前的播放地址,必然是位于动态加载或者静态的某一个文件当中。那么问题就是这个地址从哪里来的呢,我们可以通过搜索url中 的一些特殊的字符查看,例如这些数字组合,根据以往的经验判断这些数字串必然是这个视频的id,而id必然就是唯一的存在。首先要明白我们本次任务的目标——下载页面中的视频(以人物为例),那么也就意味着我们最终的目的就是要找到视频的下载地址。
原创
发布博客 2023.10.30 ·
1575 阅读 ·
5 点赞 ·
0 评论 ·
0 收藏

Python爬虫实战案例——第六例

可以看到两页不同的请求变化的参数为index和page,再多访问几页也是一样的结果,所以断定index随page变化而同步变化。这样来看就非常明显了,这个值就是从静态页面中可以直接提取的,那么我们就需要先访问详情页面将sightId值解析出来作为评论接口的参数。首先来观察静态页面,在其中我们是无法看到用户评论的,所以初步断定用户评论是异步加载的数据。进入主页之后可以看到每一个景点是根据推荐来进行排序的,所以我们如果要获取人气值最高的景点的话需要获取人气排序时的url,点击根据人气排序即可。
原创
发布博客 2023.09.28 ·
456 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Python爬虫实战案例——第五例

可以看到只有最后的数字发生了变化,前面的不管是域名还是路径都没有任何的区别。可以看到点击之后抓到的包中返回了图片url,那么也就是说通过这个包我们就可以拿到第二页的图片地址了。那么第三页呢,它的url必然和第二页是有着一定的共同之处的。这就很润了,一共九张图片都在当前这个html页面中,那么就直接xpath解析就好了,但紧接着后边页面的图片又怎么来呢。点击“查看更多”然后才会加载出来新的图片,毫无疑问,除了第一页之外的图片都是异步加载来的,所以我们来抓包分析一下。可以看到图片是位于一个。
原创
发布博客 2023.09.17 ·
3292 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python爬虫逆向猿人学刷题系列——第七题

但是这里我们对比多次请求获取到的字体文件转换的xml文件会发现每一个数字尽管其对应的name不同,但其坐标点的位置是相同的。同一个数字,它在坐标系中的坐标点是相同的,所以我们可以根据on数组是否相同来判断两次请求的数字是否是同一个,如果是同一个的话我们再去映射最先构造好的基本模板(基本模板中也要获取on数组用于和新请求中的on数组进行对比)。结合上方xml截图和响应数据截图来看相应数据的value就是xml中看到的name值,所以我们可以根据这个关系来构造一个基本的明文数字与name之间的映射模板。
原创
发布博客 2023.09.16 ·
1055 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python爬虫实战案例——第四例

在这里就可以看到入口处就是刚才定位到的d函数,所以window.asrsea函数中传递的参数依次为d函数中的形式参数d,e,f,g,打上断点来到console中测试输出不难发现这三个值都是固定值,所以就不用再去找其生成逻辑了。这个参数中的各个键值对不难分析,重复刚刚对网页的分析步骤就能够知道rid和threadId表示歌单的标识以及id组成,pageNo为页数,其它参数不用改动,所以要获取其他歌单的评论的话修改rid和threadId即可。那么接下来就要去分析e,f,g三个参数是从何处生成而来。
原创
发布博客 2023.09.15 ·
591 阅读 ·
4 点赞 ·
1 评论 ·
4 收藏

Python爬虫实战案例——第三例

字体加密的原理:就是将一种特定的字体库来代替浏览器本身的字体库显示的过程。基本流程:1. 请求页面2. 获取加密的字体库3. 解析字体库,获取字体间的映射关系4. 获取加密的字体,获取字体间的映射关系,一一对应
原创
发布博客 2023.08.28 ·
1007 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

Python爬虫猿人学逆向系列——第六题

这里其实就涉及的是浏览器的环境和nodejs环境的不同,在浏览器中window是不能被重新赋值的,所以webpack中的这个置空并没有任何意义,但是在nodejs中就不一样了,window可以被重新赋值,因此就直接导致了上方我们看到的错误信息了。所以,window.o在肯定是在代码中,至于为什么搜不到,那当然就是被混淆了,所以我们就来看看混淆的代码,就在最开头的位置,一个很明显的AA混淆,将它还原一下,这种混淆由专门的工具还原,手动还原的话就直接去掉最后的括号然后执行就可以了。啥也不是,那就直接删掉。
原创
发布博客 2023.08.24 ·
1823 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python爬虫实战案例——第二例

本篇文章主要是为大家提供某些电影网站的较常规的下载电影的分析思路与代码思路(通过爬虫下载电影),我们会从搜索某部影片的关键字开始直到成功下载某一部电影。
原创
发布博客 2023.08.23 ·
2912 阅读 ·
0 点赞 ·
0 评论 ·
15 收藏

Python爬虫逆向实战案例(五)——YRX竞赛题第五题

Python爬虫实战案例——YRX竞赛题系列题目:抓取全部5页直播间热度,计算前5名直播间热度的加和地址:https://match.yuanrenxu
原创
发布博客 2023.08.22 ·
1240 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python爬虫实战案例——第一例

X卢小说登录(包括验证码处理)地址:aHR0cHM6Ly91LmZhbG9vLmNvbS9yZWdpc3QvbG9naW4uYXNweA==
原创
发布博客 2023.08.20 ·
4845 阅读 ·
3 点赞 ·
0 评论 ·
20 收藏

Python基础语法入门(第二十三天)——正则表达式

正则表达式是一种文本模式,用于匹配字符串,它是由字符和特殊字符组成的模式。正则表达式可以用于验证、搜索、替换和提取字符串。其能够应用于各种编程语言和文本处理工具中,如Python、Java、JavaScript等。正则表达式在线测试工具:https://c.runoob.com/front-end/854/
原创
发布博客 2023.08.19 ·
193 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

猿人学刷题系列(第一届比赛)——第四题

题目:采集这5页的全部数字,计算并提交结果地址:https://match.yuanrenxue.cn/match/4。
原创
发布博客 2023.08.19 ·
4464 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Python基础语法入门(第二十二天)——并发编程

在Python中,并发编程的实现有多种方式,包括多线程、多进程和异步编程。每一种方式都有其使用的场景和特点。那么如何去选择多线程、多进程和多协程呢?要知道如何选择的话就要了解一下什么是CPU密集型计算、什么是I/O密集型计算;多线程、多进程和多协程又有什么样的区别。
原创
发布博客 2023.08.18 ·
171 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python基础语法入门(第二十一天)——异常处理

异常是程序执行过程中出现的影响程序正常执行的一个事件。当异常产生时如果没有对异常进行捕获并处理则程序会终止执行。异常处理就是让程序在处理完异常之后继续正常执行从而使程序不至于在出现异常时导致退出或崩溃。常见的异常类型Exception:所有异常的基类。可以用来捕获任何类型的异常。ValueError:当一个函数接收到一个无效的参数时引发。TypeError:当一个操作或函数应用于不适当类型的对象时引发。IndexError:当访问一个不存在的列表索引或字符串索引时引发。
原创
发布博客 2023.08.17 ·
122 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

猿人学刷题系列(第一届比赛)——第三题

本题主要考察请求逻辑,可以借助fiddler或Charles等抓包工具进行分析。
原创
发布博客 2023.08.16 ·
207 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python基础语法入门(第二十天)——文件操作

写入的时候需要注意文件打开的模式是否是二进制读写模式,以此来判断是否需要将写入的内容进行二进制转换。在实际使用中,可以根据不同的操作系统和需求选择适合的路径表现形式。在Python中,路径可以以不同的表现形式进行表示。创建文件夹,并且会创建出中间所有必要的中间文件夹,来确保完整路径名存在。可以指定文件的名称和打开模式(读取模式、写入模式等)。函数打开文件后,应该始终在不需要文件时关闭文件,以释放资源。函数是Python中用于打开文件的内置函数。在不同的操作系统中,路径使用的斜杠并不是相同的,但是可以通过。
原创
发布博客 2023.08.15 ·
142 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

猿人学刷题系列(第一届比赛)——第二题( js 混淆 - 动态cookie 1)

题目:提取全部5页发布日热度的值,计算所有值的加和地址:https://match.yuanrenxue.cn/match/2。
原创
发布博客 2023.08.12 ·
7173 阅读 ·
4 点赞 ·
0 评论 ·
8 收藏

Python基础语法入门(第十九天)——可迭代对象与生成器对象

在上文中提到——凡是实现了__iter__()方法的对象都视为可迭代对象。那么在实现自定义的可迭代对象时,需要在类中重写__iter__()方法来进行创建。print(i)在上述示例中,定义类MyIterable,在类中实现了__iter__()方法。在该方法中通过内置函数iter()函数将self.data转换为迭代器对象,从而使得MyIterable的示例称为了一个可迭代对象,通过来循环遍历该实例中的元素。
原创
发布博客 2023.08.12 ·
231 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏
加载更多