豆瓣电影短评数据采集演示
正常获取短评是从网页版豆瓣来进行获取
通过分页来获取下一页所需要的数据
但经过测试发现 在不登录的情况下 获取的页码有限 在请求到一定页码时 会一直显示加载中 或直接会跳转到首页 如果需要继续获取的话 则需要进行登录来获取指定参数dbcl2 比较麻烦
这次选择通过app客户端进行抓包分析 接口如下
这里是通过抓包app解析出的短评接口
参数解析
start: 分页参数
count: 每页展示数
_sig: 签名
_ts: 时间戳
这些参数需要动态加载 其余参数都可直接写死
_sig参数为使用指定字符串加密而成 具体生成方法 可通过反编译客户端 进行搜索逆向 这里不做具体分析
最后打印请求结果
通过更换不同的电影id 来获取对应的电影短评
这里就是可以不需要登录来获取短评的方法
欢迎大家指正沟通 如果有更好的方法欢迎大家沟通交流