本系列教程简单的介绍了python网络爬虫。
Python:3.7.4
Request库:2019.4.13
beautifulsoup4:4.8.1
Scrapy 1.8.0
爬取的网站:http://www.weather.com.cn/weather/101010100.shtml
北京一周7天的天气预报。
网络爬虫,也叫网络蜘蛛(Web Spider)。它根据网页地址(URL)爬取网页内容,而网页地址(URL)就是我们在浏览器中输入的网站链接。简单的说,网络爬虫就是从网上获取数据。
本系列教程包括:
1 python网络爬虫Simple(2) requests和beautifulsoup4安装和使用
2 python网络爬虫Simple(3) scrapy爬虫框架