我使用的是python2.7版本,windows下操作。所以在写代码之前肯定是要完成python的环境搭建。环境搭建网上也有很多资料,在此我不做多介绍。
接下来开始我的爬虫开发,写的时候自己也不懂,所以在网上查了很多资料。主要有两个步骤:
1.python实现模拟登陆
loginurl = “http://192.168.1.195/index.php“
1.首先查看loginurl如何实现登陆
在登陆页按下F12,点击network的preserve log(记住一定要点,不然后面找不到自己想要找的东西),输入用户名密码,然后在登陆后的页面找到headers,
我们可以看到Form Data即为post提交的数据。有cookie说明我们必须设置cookie处理器来保证cookie,并且访问时必须有user-agent,否则客户端会被屏蔽。
2.python模拟网页登录主要使用urllib,urllib2,cookielib,BeautifulSouup等基本模块,我们需要安装第三方模块。
pip install beautifulsoup4(如果没有安装pip先安装pip)
3.附上我的代码
#coding=utf-8
import urllib
import urllib2
import cookielib
from bs4 import BeautifulSoup
#python2.7实现模拟登陆,爬取图片
class crawl1():
def