群友:谁帮我下个xx文库的文件 大佬:过来,我给你爬一下

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

以下文章来源于腾讯云 作者:Python进击者

( 想要学习Python?Python学习交流群:1039649593,满足你的需求,资料都已经上传群文件流,可以自行下载!还有海量最新2020python学习资料。 )
在这里插入图片描述

XX文库分析
PPT
在这里插入图片描述
首先我们来分析一下PPT的下载,其实对于这种数据一般都是采用抓包的思路来进行的。
在这里插入图片描述
我一个一个找了一下,发现上面的数据包中有我们想要的数据,我们看下拿到了什么数据:
在这里插入图片描述
我们看到了有一个参数为20。恰好,我们想要下载的PPT也是20页,于是访问一下zoom中的链接。
在这里插入图片描述
正是我们要的,所以后面你懂得,就交给帅气牛逼的你了!
在这里插入图片描述
随意找了个word文档,同样的思路,我们还是来抓包,当然这个包跟我们之前的肯定不同。
在这里插入图片描述
同样查看这个包,看看这个包给了我们什么数据:
在这里插入图片描述
可以看到这就是word当中的文字信息,当然有些小伙伴说为啥你这不只是拿到文字信息么?确实这样只能拿到文字信息,但是在这串数据里面有相应的位置坐标信息。帅气牛逼的你们可以自己取折腾折腾!
txt
关于txt就有点小麻烦了,首先我们需要获取该txt文档的id名称

在这里插入图片描述
然后我们直接进行url的搜索
在这里插入图片描述
搜索关键词,975114ef19e8b8f67c1cb9d9是我的文件id,自己修改

wkretype.bdimg.com/retype/text/975114ef19e8b8f67c1cb9d9

我们双击筛选出来的包:
在这里插入图片描述
你可能一脸懵逼,但是我们去转换一下字符编码:
在这里插入图片描述
可以看到正是我们需要的数据。后面的大家就自己解决啦!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值