- 博客(3)
- 收藏
- 关注
原创 水一个某条爬虫gui可视化案列
以前不是特别了解都是流水账一样写代码,导致到最后功能越多,单个文件代码越长,想要修改要找半天,用上类之后再调用导入会好很多,这应该也是之前学的scrapy的精髓吧。获取数据的内容是关于某条的,获取数据没什么难度,主要还是关于类的编写,这就考研大局观了,哈哈。做这玩意很大程度上能对之前的一些知识点做一个总结,尤其是面向对象。在gui中可以添加很多的功能配置,每个配置后面需要有一个类的支撑。如有侵权,请联系我进行删除。
2023-08-06 10:20:47 35
原创 记录下爬取某直播间实时弹幕
我们知道md5加密一串字符串得到的结果是唯一的,‘123456’的md5加密值可以记下啊,以后碰到都可以验证下,注意是字符串要带引号,所以这验证结果就是个标准的md5,不放心的可以再写个py验证下也是很方便的,把 i.substring(1)这个值本地md5加密跟网页上的对比下就行,那么到这里X-MS-STUB就搞定了。这个因为之前爬过评论之类,一看跟之前那个X-Bogus有点不一样,进去vmp可以看到这里面有好几个return (一大堆)这样的东西,所以在同一段加密文件里面用的不一样的加密函数。
2023-08-06 09:37:44 788 2
原创 爬取漫画小说制作电子书
漫画小说跟普通的文本小说最大的区别就是在文本中会穿插图片,这样比起普通文本下载会有一个非常关键的点,就是下载到的图片要穿插进文本的正确位置才能不影响阅读体验,所以将漫画小说写入epub格式是一个非常不错的选择。
2023-08-06 08:26:10 36
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人