- 博客(2)
- 收藏
- 关注
原创 红薯中文网小说爬取
红薯中文网小说爬取 描述 红薯中文小说网,采用了js动态加载小说内容部分汉字或符号。本仓库介绍如何破解js将小说内容完整的爬取下来。 我们首先用浏览器F12查看下页面情况,页面连接:https://g.hongshu.com/content/93416/13877912.html 图片中少量汉字都是使用span标签对应上去的,我们在点击span标签的时候在右边可以看到 .context_kw23...
2019-08-24 17:36:08 1453
原创 针对大众点评网上商铺评论字体替换反爬的反反爬
针对大众点评网上商铺评论字体替换反爬的反反爬 字体替换的反爬,在之前网站出现过,如淘宝、猫眼等。但是主要针对于数字字体替换,由于数字就十个,完全可以手动分析字体文件,找出编码与数字的关系。但是,大众点评评论中的字体文件中的文字共603个,手动写对应关系是不可能的事。 下面将介绍一种可行的方案: 这是进入商铺页面 http://www.dianping.com/shop/130096343 我们可...
2019-08-03 10:57:29 5131 14
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人