想要抓取企业数据,第一个地方工商局,其次,天眼查,企查查,爱企查之类的。
工商局的还没看,个查可以先看看。天眼查,一般有一页不需要登录的,这种事可以刷ip的。
有些数据是必须登录才能获取的,先研究下登录代码。
1.登录抓包
通过请求可以看到很多的参数:
1)账号是明文的
2)密码加密了,具体加密方式不确定
3)其他参数好多,在加载中查找能够看到到,在一个接口中返回
在上面的请求可以看到返回的参数是,下一次请求需要用的内容,从接口关键词和上一个文件大概知道是极验验证,百度一下那个js文件名,说是第四版,这个比较麻烦,先不研究了。先搞定password吧。
2.断点抓包
在断点位置可以看到很多变量,这些都是 及验证生成的,在加密前可以看到 名的密码和明文的账号。
单独执行能看到结果,但是不确定算法。
追着函数跑了一圈也没看到秘钥啥的,一般应该是可还原的算法,感觉应该是des、aes啥的,难道不是。
最后打开常用算法一对比,竟然md5.看来服务器存储的就是密文啊。
看来网站真能糊弄了,当年那么火的网站,现在好多人说 不如企查查了。没落了啊