初学Python,学到Python爬虫时在网上找资料,发现找到的大部分都是前部分内容对运作方式介绍,然后就直接上代码了,这样对像我一样的小白来说比较困难,代码的注释较少,部分代码块没有详细说明运作方式和具体作用,所以写此笔记方便别人和自己以后进行学习查看。
--操作系统window--Python2.7.10
爬取网站编码:utf-8 ,如果运行显示的汉字不正确更改你本地的编码类型为utf-8进行解码即可显示正常的汉字
dome使用的是from bs4 import BeautifulSoup这个模块需要安装,下载地址在最后,windows在cmd下直接使用命令安装这个模块,或手动下载安装:
windows安装命令:
pip install