自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 笔**阁小说采集

而我们需要的文本都是在 <div id="chaptercontent" class="Readarea ReadAjax_content">这个容器里的,拿到这个容器的text文本就结束了。章节是在<div class="listmain">容器下的一些dd里,拿到这个dd的href属性就可以了,将其存储在一个列表中返回,标题同理。

2024-04-09 16:58:19 349 1

原创 ddddocr库的使用与常见问题的解决

它是一个开源项目,提供了训练和预测的功能,可用于识别图片中的双位数字并输出其具体的数值。在日常使用中,比较常见的场景就是数字字母等验证码的识别以及部分的图片文字识别,ddddocr(四弟)呢就凭借着其使用的便捷性和结果的准确性深受人们青睐。因为classification接收的就是bytes格式的参数,所以如果是在网络上请求得到的图片,不用把图片先保存到本地再读取识别,直接把那个二进制流输入给classification就可以了。如果不想要这段信息,直接ctrl加左键进入源文件,搜索打印出的信息。

2024-04-08 17:03:57 498

原创 某财联的sign逆向——保姆教程

接下来你高高兴兴的以为逆向成功并且结束了,但其实不然一比较就会发现,其实sign的值位数对了,但是值不对,为什么呢?在return的地方打上断点,并打印出p(t, e[t])的值,不难发现这一步就是在构建请求体中除去sign的其他参数。由于是三十二位加密结果,我们首秀考虑是不是标准加密算法,一看,就是标准的MD5算法。点击加载更多,如果断住了,则进行跟栈分析,如果没有断住,那就检查关键字断点,继续打。在控制台打印出S(m({}, r))的值,发现与请求参数的位数一致,成功了50%

2024-04-06 15:20:02 196 1

原创 网页版douyin.com评论获取三

首先我们把依次请求得到一级评论,在解析出数据后,根据评论ID去得到每一条评论下的回复(假如有,try一下就可以),然后把得到二级评论封装在列表中,返回所有的结果,加上第一级评论的信息在封装为一个列表,最后所有的评论信息再封装为一个列表。(一)对于返回数据的处理可以参照上一篇的方法,只是说二级评论和一级评论在数据的结构上可能存在一些差异,建议把数据处理的逻辑呢要分开。#看完前两篇可能不少小伙伴就有疑问了,为什么喔的循环都写冒烟了,三万的评论还是只能搞到三千条,其他的是被帖主吃掉了吗?至此,分享就结束了!

2024-04-06 13:40:19 904 1

原创 网页版douyin.com评论获取二

可以看到其实就是一个comments列表,只需要对这个列表进行循环处理其中的每一个字字典,就可以得到想要的评论和其他数据内容了。返回的数据都是以字符串的格式,这对于我们对其进行分析和解析使用是非常不利的,毕竟没人想要用正则来匹配这么多字符。这样格式的数据内容,然后就是分析这些内容在浏览器的渲染出的结果是什么,并进行提取。得到的内容就是请求得到的评论内容以及一些其他属性,继续进行json格式化分析。然后我们将每一次得到的数据放到支持json格式化的网页上,进行解析分析。二、用json规则提取我们需要的信息。

2024-04-06 12:57:46 262 1

原创 网页版douyin.com评论获取一

经过研究发现,aweme_id在同一视频的请求下是不变的,而cursor和count是变化的(其实就是cursor就是从第几条评论开始,count就是每次请求的评论数),至于webid就是你自己的账号,msToken和a_bogus的话有兴趣有能力的小伙伴可以去逆向一下,这个参数不变也是可以的。夏天到来,当哥们儿想打开抖音刷到一些比较凉快的视频,动不动就上万的评论,手痒就想看看众位爱卿的虎狼之词,但是一条条翻可不是我们的风格,所以直接F12。的接口,接下来就是分析这个接口的请求体和返回数据的格式与解析了!

2024-04-06 10:59:09 883 1

原创 yolov5使用labelimg数据标注——classes.txt的覆盖问题

如果需要标注的图片比较多,单次无法完成工作,单次结束工作后确认保存没问题,保存结果也正确,但是下次打开相同文件时标注再保存就会发现最新一次的标注的classes.txt 覆盖了原来的txt文件,而不是追加。(2)后续打开时,在labelimg命令后追加图片路径和已经保存的classes.txt,例如 :labelimg data\images data\classes.txt。(1)第一次标注时直接打开命令行,输入labelimg,指定好图片和标注结果目录就行。打开labelimg的命令。

2024-04-02 09:10:58 446 2

原创 DrissionPage浏览器配置

正确配置DrissionPage的浏览器依赖

2024-02-07 14:16:29 1406 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除