巨潮网怎么下载年报_如何下载上市公司的年度报告

本文详细介绍了如何在巨潮资讯网和新浪财经(雪球)上搜索并下载上市公司的年度报告。首先,通过巨潮资讯网的搜索功能,选择公司代码、类型为年报并设置日期范围来查询。然后,选择需要的年报,点击下载公告即可。其次,通过雪球或新浪财经搜索目标公司,进入公告列表,同样选择年报并下载。两种方法均能有效获取上市公司年度报告的PDF文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在分析上市公司时,我们需要对公司某一年的经营情况、财务数据等有一个比较全面的了解。这时就要去下载想要了解的年份的PDF的年度报告。

常用的下载地址有巨潮资讯网或雪球(雪球的年报地址是新浪财经的地址):

下面分别介绍对应网站的年度报告搜索下载方法:

一、巨潮资讯网

网址是:http://www.cninfo.com.cn/new/index

打开后的页面如下图所示:

巨潮资讯网主页

下面以格力电器为例介绍如何搜索年度报告的方法。

第一种方式:

搜索框

1、在上图的1中输入格力电器的代码 000651 或者 拼音首字母GLDQ 或者简写汉字“格力电器” 然后会自己弹出如图所示的选项:

选中这个选项后会,不管是哪种方式输入的股票都会在图二、搜索框1处显示股票的代码。

2、点击 搜索框 2 的列表会弹出如下图所示的选择项:

类型选择

勾选年报这项,然后点确认。

3、点击图二、搜索框 3的列表会弹出如下图所示的选择日期的窗口。

日期选择

在这个新的弹出框中可以根据自己的需要选择起始日期和结束日期。点击最左边的文字项可以的快速选择日期。

设置好了后点击“查询”按钮,就会跳转到网址:http://www.cninfo.com.cn/ne

### 使用Python从巨潮资讯网抓取和下载上市公司年报数据 要实现从巨潮资讯网抓取并下载上市公司年报数据的任务,可以按照以下方式构建爬虫程序。此过程涉及多个步骤,包括发送HTTP请求、解析HTML页面以及处理JSON响应。 #### 工具与库的选择 为了完成这一任务,通常会使用到以下几个主要的Python库: - `requests`:用于发起网络请求。 - `BeautifulSoup` 或 `lxml`:用于解析HTML文档。 - `selenium`:当目标网页内容由JavaScript动态加载时,可用来模拟浏览器行为。 - `pandas` 和其他数据分析工具:可用于后续的数据整理与分析[^1]。 #### 请求与解析流程 首先定义函数获取公告列表,这里假设已经知道如何构造URL访问特定年份或时间段内的公告信息: ```python import requests from bs4 import BeautifulSoup def get_announcement_list(year, stock_code): url = f"http://www.cninfo.com.cn/new/disclosure/stock?plate=szse&tab=report&year={year}&code={stock_code}" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)', } response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') announcements = [] for item in soup.select('.item'): title = item.find('a').text.strip() link = "http://www.cninfo.com.cn" + item.find('a')['href'] date = item.find('span', class_='date').text.strip() announcements.append({'title': title, 'link': link, 'date': date}) return announcements ``` 接着可以根据返回的结果进一步筛选出符合条件的具体年报链接,并将其保存至本地文件系统中: ```python def download_report(file_url, save_path): r = requests.get(file_url, stream=True) with open(save_path, 'wb') as fd: for chunk in r.iter_content(2048): fd.write(chunk) announcements = get_announcement_list(2023, '000001') for ann in announcements[:5]: if '年度报告' in ann['title']: file_name = ann['title'].replace('/', '_') + '.pdf' full_file_path = '/path/to/save/' + file_name print(f'Downloading {file_name}') try: download_report(ann['link'], full_file_path) except Exception as e: print(e) ``` 上述代码片段展示了基本逻辑框架,实际应用过程中可能还需要考虑异常情况处理、代理设置等问题[^4]。 #### 数据存储与后期处理建议 一旦成功下载所需PDF版本的企业年报之后,则可以通过诸如PyPDF2之类的第三方模块读取这些文档的内容以便于执行更深层次的信息挖掘操作;或者利用OCR光学字符识别技术转换图像型态资料成为结构化文本形式再导入数据库进行统一管理查询等等[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值