小红书只用于做技术分享案例
首先逆向部分如果不懂jsvmp,就不用研究了.(根本看不懂)
首先是不登录首页数据版本
加密参数x-s ,x-s-common
首先需要验证获取cookie访问首页数据,不同的分类参数不一样
1./api/sec/v1/shield/webprofile访问接口就行验证
2.https://edith.xiaohongshu.com/api/sns/web/v1/login/activate获取里面的gid 和sessionid
最后拿着请求头,cookie就可也访问首页数据
2.第二个版本就是登录的版本
登录版本的x-s和接口的X-s不一样有个md55加密还.(具体自己分析了)
然后就是搜索指定帖子的
翻页需要判断一下,有下一页has_more为true,session过期状态-100,出现滑块,461.
(好像找个划过的滑块id,放进cookie能减少出现的概率,滑块这里我就不发了,没啥意思)
2.获取评论
评论这里还有子评论,子评论下面还有个更多回复,稍微复杂一点
子评论是有专门的接口,搜索用户信息的连接个搜索别的有点区别
剩下的其实都差不多
还有个获取话题tag_list
有个md5加密,用户信息比较简单直接html页面xpath(需要登录,登录后的信息准确)
友情提示,爬取小红书数据.(有巨大的危险,这里只是记录一下学习笔记.无任何不良指导,就是锻炼锻炼业务能力)