大家好,小编来为大家解答以下问题,python爬虫爬取天气数据讲解,如何用python爬取天气预报,今天让我们一起来看看吧!
大家好,小编来为大家解答以下问题,python爬虫爬取天气数据讲解,如何用python爬取天气预报,现在让我们一起来看看吧!
爬虫5步曲:
1.安装requests and beacutifulsoup4库
2.获取爬虫所需的header 和cookie
3.获取网页,解析网页
4.分析得到的数据简化地址
5.爬取内容,清洗数据
1.安装requests&beautifulsoup4
pip3 install requests
pip3 install beautifulsoup4
2.获取爬虫所需的header 和cookie
打开想爬取的网页后按下F12打开开发者模式,就会出现网页的js语言设计部分。如下图所示c加加和python哪个值得学不会c语言也可以学python。找到网页上的Network部分。然后按下ctrl+R刷新页面。如果,进行就有文件信息,就不用刷新了,当然刷新了也没啥问题。然后,我们浏览Name这部分,找到我们想要爬取的文件,鼠标右键,选择copy,复制下网页的URL。就如下图所示。
复制好URL后,我们就进入Convert curl commands to code (curlconverter.com)。这个网页可以根据你复制的URL,自动生成header和cookie,如下图。生成的header和cookie,直接复制走就行,粘贴到程序中。
3.获取网页,解析网页
我们将header和cookie搞到手后,就可以将它复制到我们的程序里。之后,使用request请求,就可以获取到网页了。这个时候,我们需要回到网页。同样按下F12进入开发者模式,找到网页的Elements部分。用左上角