群友：谁帮我下个xx文库的文件大佬：过来，我给你爬一下

最新推荐文章于 2024-10-12 12:26:23 发布

49.99%

最新推荐文章于 2024-10-12 12:26:23 发布

阅读量110

点赞数

分类专栏： python 文章标签： python

原文链接：https://cloud.tencent.com/developer/article/1625031

版权

python 专栏收录该内容

605 篇文章 21 订阅

订阅专栏

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

以下文章来源于腾讯云作者：Python进击者

( 想要学习Python？Python学习交流群：1039649593，满足你的需求，资料都已经上传群文件流，可以自行下载！还有海量最新2020python学习资料。 )
在这里插入图片描述

XX文库分析
PPT
在这里插入图片描述
首先我们来分析一下PPT的下载，其实对于这种数据一般都是采用抓包的思路来进行的。

我一个一个找了一下，发现上面的数据包中有我们想要的数据，我们看下拿到了什么数据：

我们看到了有一个参数为20。恰好，我们想要下载的PPT也是20页，于是访问一下zoom中的链接。
在这里插入图片描述
正是我们要的，所以后面你懂得，就交给帅气牛逼的你了！

随意找了个word文档，同样的思路，我们还是来抓包，当然这个包跟我们之前的肯定不同。

同样查看这个包，看看这个包给了我们什么数据：
在这里插入图片描述
可以看到这就是word当中的文字信息，当然有些小伙伴说为啥你这不只是拿到文字信息么？确实这样只能拿到文字信息，但是在这串数据里面有相应的位置坐标信息。帅气牛逼的你们可以自己取折腾折腾！
txt
关于txt就有点小麻烦了，首先我们需要获取该txt文档的id名称

在这里插入图片描述
然后我们直接进行url的搜索

搜索关键词，975114ef19e8b8f67c1cb9d9是我的文件id，自己修改

wkretype.bdimg.com/retype/text/975114ef19e8b8f67c1cb9d9

我们双击筛选出来的包：
在这里插入图片描述
你可能一脸懵逼，但是我们去转换一下字符编码：

可以看到正是我们需要的数据。后面的大家就自己解决啦！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。