金角大王和银角大王盛名流传于网络,有机会听一下大王的课程也是美事。于是就加入了一个群,听听大王讲课。
个人对python多线程 多进程爬虫较为熟练,常用requests库。
requests简单好上手,非常方便,进阶的话可以使用scrapy.
自动登入拉勾网并修改信息步骤如下:
1 拉勾网为了防访问,在headers里需要 X-Anit-Forge-Code 和 X-Anit-Forge-Token 这两个值,这两个值访问拉勾登录网页可以获取。
2 然后访问登录url,并将账户、密码和上面两个值携带进去。当然,headers里的值最好写全。复制代码
3 当然,获取了登录成功的cookie也不一定可以修改信息。这时还需要用户授权。访问 https://passport.lagou.com/grantServiceTicket/grant.html这个网页就可以获取到
4 用户授权会重定向一系列的url,我们需要把重定向的网页的cookie全部拿到。重定向的网页在上一个url中的Location里。
5 接下来就是修改信息了,修改信息时访问的url需要传入submitCode和submitToken这两个值,通过分析可以得到这两个值在访问 https://gate.lagou.com/v1/neirong/account/users/0/这里url的返回值中可以获取。