爬虫练手-国家统计局数据获取和分析

进入统计局数据查询页面
在这里插入图片描述
一般数据查询,然后可以直接下载为电子表格,非常方便。不过若需要左侧栏比较多数据,那么可以查看连接,通过接口请求获取。
在这里插入图片描述
观察接口,然后用Python模拟数据请求,代码如下:

# 解析URL,提取参数及其值
url = "https://data.stats.gov.cn/easyquery.htm"

params = {
    'm': 'QueryData',
    'dbcode': 'fsnd',
    'rowcode': 'zb',
    'colcode': 'reg',
    'wds': '[{"wdcode":"sj","valuecode":"2021"}]',
    'dfwds': '[{"wdcode":"zb","valuecode":"A0502"}]',
    'k1': str(int(time.time() * 1000)),
    'h': '1'
}

# 发送GET请求
response = requests.get(url, params=params, verify=False)

# 输出响应内容
print(response.text)

data = response.json()

在这里插入图片描述
这些数据看起来和页面的有些区别,因为这里很多中文都用标识来代替了,若要还原表格,可以查看返回数据中的data["returndata"]["wdnodes"], 然后把code和对应cname 做一个字典匹配。

def handle_data_to_dict(wdnode):
    """
    处理数据字典
    :param wdnode:
    :return:
    """
    zb_dict = {}
    reg_dict = {}
    for item in wdnode:
        if item["wdcode"] == "zb":
            for node in item["nodes"]:
                # print(node["cname"], node["code"], node["unit"])
                zb_dict[node["code"]] = f'{node["cname"]}({node["unit"]})'
        if item["wdcode"] == "reg":
            for node in item["nodes"]:
                # print(node["cname"], node["code"])
                reg_dict[node["code"]] = node["cname"]
    return zb_dict, reg_dict

想获取完整代码可以关注我的公众号,发送国家统计局,获取连接。
请添加图片描述

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
安居客是一个房地产信息网站,为了获取其中的数据,可以使用Python编写爬虫程序进行网页内容的抓取。通过分析网页的结构和规律,可以从安居客网站上获取所需的数据爬虫程序可以通过请求网页的URL,获取网页的HTML源码,然后使用Python的相关库(如BeautifulSoup)对HTML进行解析,提取出需要的数据。 在获取数据之后,需要进行数据清洗。数据清洗是指对采集到的原始数据进行清理、处理,使其符合数据分析的要求。例如,去除重复数据、处理缺失值、剔除异常值等。通过使用Python数据处理库(如pandas)可以方便地进行数据清洗的操作。 数据清洗完成后,可以进行数据分析数据分析是指对清洗后的数据进行统计、计算、挖掘等操作,以获取其中的有价值的信息和规律。Python中有很多用于数据分析的库,如numpy、scipy、matplotlib等。可以使用这些库进行数据的统计分析、机器学习算法的实施、模型的构建等。 最后,为了更好地展示分析结果,可以进行数据可视化。数据可视化是指使用图表、图像等形式将数据进行直观、易懂的展示。Python中的matplotlib、seaborn等库提供了丰富的图表绘制功能,可以将数据转换为直观的图表,以便更好地帮助用户理解和分析数据。 综上所述,通过安居客数据的爬取、数据清洗和数据分析可视化,可以获取并理解网站上房地产相关的有价值信息,为用户提供更好的数据分析与决策支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值