01 GDP历史记录抓取处理并入库案例

最新推荐文章于 2024-06-12 10:18:59 发布

VikenBrain

最新推荐文章于 2024-06-12 10:18:59 发布

阅读量348

点赞数

分类专栏： Python SQL与数据库文章标签：数据分析 python 数据库 mysql

本文链接：https://blog.csdn.net/Unsicherheit/article/details/109487420

版权

本文介绍了一个使用Python进行GDP历史数据抓取、处理及存储到MySQL数据库的案例。首先，项目描述了整个操作流程；接着，详细展示了代码实现，包括设置headers和数据库配置；最后，作者进行了总结，提倡利用阿里云RDS和可视化工具如Navicat，强调不应过度投入在工具选择上，而应关注技术本身的发展。

摘要由CSDN通过智能技术生成

01 项目描述

1. 项目需求
    1.1 步骤
        1.1.1 抓取GDP历史数据
        1.1.2 将抓取的数据通过Pandas这一数据处理工具进行数据清洗
        1.1.3 将清洗好的数据存放如mysql数据库

2. 使用工具
   Python + Pandas + Xpath

02 代码实现

import requests
import time
from lxml import etree
import pandas as pd
from sqlalchemy import create_engine


class KYLC():

    def __init__(self):

        self.url = 'https://www.kylc.com/stats/global/yearly/g_gdp/{}.html'
        self.headers = {'设置你的headers'}
        self.time = [i for i in range(1960,2020)]


    """抓取网页数据"""
    def get_raw_data(self):
        tables = pd.DataFrame()
        # GDP表的编制是从1960年开始的
        for i in self.time:
            url = self.url.format(i)
            time.sleep(1)
            resp = requests.get(url, headers= self.headers).text
            tree = etree.HTML(resp)
            code_list = tre

最低0.47元/天解锁文章

VikenBrain

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
01 GDP历史记录抓取处理并入库案例

01 项目描述1. 项目需求 1.1 步骤 1.1.1 抓取GDP历史数据 1.1.2 将抓取的数据通过Pandas这一数据处理工具进行数据清洗 1.1.3 将清洗好的数据存放如mysql数据库2. 使用工具 Python + Pandas + Xpath02 代码实现import requestsimport timefrom lxml import etreeimport pandas as pdfrom sqla
复制链接

扫一扫

专栏目录