新手入门python爬虫,爬取各城市历史天气数据,超级简单

1.先安装必要的模块

先进入python的安装目录下的Scripts目录,地址栏敲cmd回车然后输入下面命令回车:

pip install requests bs4

2.然后就可以愉快的码代码了

其实爬虫的本质就是一个http请求,难的就是数据的分析和截取,这个demo的数据还是挺好分析的,分析如下:
在这里插入图片描述
快速获取html标签,得到自己想要的标签数据
在这里插入图片描述

import requests
from bs4 import BeautifulSoup

if __name__ == "__main__":
    print("#####查询历史天气爬虫#########")
    city = input("输入城市拼音如岳阳(yueyang):")
    date = input("输入时间如2020年3月(202003):")
    # 拼接要爬取的地址
    domain = 'http://lishi.tianqi.com/' + city + '/' + date + '.html'
    # 这里设置请求头数据不然会拒绝访问
    header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0"}
    res = requests.get(url=domain, headers=header)
    # 将返回数据解析
    bf = BeautifulSoup(res.text, "html.parser")
    # 下面就是分析数据啦,拿到对应html标签下面的内容
    dateContent = bf.select("body > div.main.clearfix > div.main_left.inleft > div.tian_three > ul > li > div.th200")
    dateContent = [i.string for i in dateContent]
    temperature = bf.select("body > div.main.clearfix > div.main_left.inleft > div.tian_three > ul > li > div.th140")
    temperature = [i.string for i in temperature]
    i = 0
    # 然后这里循环打印爬取的数据
    while i < len(dateContent):
        print(dateContent[i], "\t", temperature[4 * i + 1], "-", temperature[4 * i], "\t",
              temperature[2 + 4 * i])
        i += 1

最后是效果图(排版有点丑)

在这里插入图片描述

【资源介绍】 课程大作业基于Python爬取各省降水量数据及可视化分析源码+项目说明+超详细注释. 因为相关课程的缘故,需要在1个月内速成python,故选取了python最常用的爬虫作为实操训练 同时,还添加了可视化和GUI入门的内容使爬取的内容应用更丰富 在具体数据的选取上,我爬取的是各省份降水量实时数据 ###### *话不多说,开始实操* ### 正文 1. 爬取数据 - 使用python爬虫爬取中国天气网各省份24时整点气象数据 - 由于降水量为动态数据,以js形式进行存储,故采用selenium方法经xpath爬取数据 ps:在进行数据爬取时,最初使用的方法是漂亮汤法(beautifulsoup)法,但当输出爬取的内容(<class = split>时,却空空如也。在源代码界面Ctrl+Shift+F搜索后也无法找到降水量,后查询得知此为动态数据,无法用该方法进行爬取 - 使用循环和分类的方式爬取省份不同、网址相似的降水量数据,顺带记录数据对应的城市 - f—string: ```python url_a= f'http://www.weather.com.cn/weather1dn/101{a}0101.shtml' ``` *f-string 用大括号 {} 表示被替换字段,其中直接填入替换内容* - 将城市和降水量相对应后存入字典再打印 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,也适用于小白学习入门进阶。当然也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或者热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载,沟通交流,互相学习,共同进步!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值