金融数据挖掘（一）：A股上市公司2022年年报

成都的赵雷

已于 2024-02-27 20:33:15 修改

阅读量3.7k

点赞数 27

分类专栏：金融文章标签：金融数据库 python

于 2022-06-22 23:38:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yinzehao/article/details/125409698

版权

A股上市公司年报，是我们分析上市公司财务状况和经营状况，并进行股票估值和行情预测的重要依据。那么，我们应该如何爬取这些上市公司的财报数据，并用于数据分析和可视化呢？今天我们以东方财富网为例，来介绍一下基本的步骤。

一、操作环境

1. 浏览器：Safari浏览器（版本：17.31）

2. Python版本：Python3.12

3. 开发环境：Pycharm 2023.3（Community Edition）

4. 操作系统：MacOS 14.3（Sonoma）

二、网页解析

1. 点击如下网址，进入数据页面

2022年年报业绩大全 _ 数据中心 _ 东方财富网

2. 页面空白处“点击右键”——“检查元素”，进入开发者工具。

选择”网络“标签页，然后刷新网页，获取所有网页加载项。

3. 对列表中的所有加载项依次进行预览，寻找数据源地址。

以本次操作为例，数据源的网址为（数据源网址是动态生成的）：

https://datacenter-web.eastmoney.com/api/data/v1/get?callback=jQuery112307880322881038256_1709033016691&sortColumns=UPDATE_DATE%2CSECURITY_CODE&sortTypes=-1%2C-1&pageSize=50&pageNumber=1&reportName=RPT_LICO_FN_CPD&columns=ALL&filter=(REPORTDATE%3D%272022-12-31%27)

4. 分析数据源网址，找出真正的数据源接口

一般网址的基本结构为：

协议://域名(IP:端口)/资源路径?查询条件(结构：key1=value1&ke

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。