items.py这个文件,如果不用item的话就可以不用写。
1、自动登录豆瓣,所以要知道豆瓣的网址:https://www.douban.com/
2、要找Post表单,打开源文件,找到method="post",可以看到旁边的action="https://www.douban.com/accounts/login,这个url,在一般情况下,不一定是真正的表单,如果有反爬机制强的话,很有可能就不是,所以尽量抓包分析,推荐用抓包工具fiddler。
3、登录需要账号和密码,分析源文件,可以看到name="form_email