python 批量下载财务数据_Python+Wind 批量下载上市公司年报 - Part 1/2

本文介绍了如何使用Python结合Wind下载上市公司的年报。通过安装Anaconda,设置爬虫,提取公告链接,最后抓取并下载PDF年报。教程详细讲解了每个步骤,包括使用XPath提取PDF地址,并提供了完整代码。
摘要由CSDN通过智能技术生成

Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷

目录1.背景介绍

2.安装Python

3.爬取万得上市公司年报3.1Wind下载公告信息

3.2获得年报地址

4.使用Python抓取PDF年报

5.总结

关于我

1. 背景介绍

蚊子正在进行的研究项目涉及到一个数据无法直接从数据库下载,只能手动从公司年报收集。

经过一番查找,蚊子获知目前能获取上市公司年报的网站或数据库有巨潮资讯网、上交所、深交所、Wind万得等。但是他们均不提供年报批量下载。

听说Python可以爬虫下载年报,蚊子做好了花两三周的时间学习Python的准备。没想到不经意间发现了连享会的公众号文章“Python:爬取上市公司公告-Wind-CSMAR”,大大缩短了蚊子的学习时间,半天就能上手了。

以下是实施步骤:

安装Python

Wind下载公告信息

获得年报地址

使用Python抓取PDF年报

2. 安装Python

蚊子安装的是ANACONDA。安装过程中能打钩的都打钩。运行Jupyter Notebook即可运行Python。

3.爬取Wind上市公司年报

3.1 Wind下载公告信息登录Wind

上方菜单点击“新闻”->“公司公告”->“沪深股票”

点击“高级搜索”标题不包含“摘要”,如果不要ST股,也可以加入关键词“ST”

公司类型选择“年度报告”

所属市场选择“全部A股”

公告日期根据自己的研究需求选择

<
该系统主要是为了解决行业研究在提取公司财务数据以及进行财务数据分析时过于繁琐的问题。由于目前金融业使用wind较多,故本系统暂时采用了wind接口,通过自动化从wind提取相关公司财务数据并自动进行财务分析, 最后会将得到的结果以excel的形式输出到本地。 功能特点 提取数据。该系统目前主要整合了wind的python API接口,通过设定初始时间和结束时间及公司代码和名称,就可以直接通过wind的API提取财务数据。 覆盖全方位财务分析指标 盈利能力 毛利率 经营利润率(EBIT/net revenue) 净利率 ROA ROE ROIC(投入资本回报率) 销售费用率 管理费用率 财务费用率 销售期间费用率(三费加上研发/营业收入) 营运能力 总资产周转率(turnover=net revenue/assets) 固定资产周转率(net revenue/average net fixed assets) 营运资本周转率(net revenue/average working capital,here WC=current assets-current liabilities) 应收账款周转天数 应付账款周转天数 存货周转天数 营业周期(Operating cacle=应收账款周转天数+存货周转天数) 现金循环周期,又名净营业周期(Cash conversion cycle=应收账款周转天数+存货周转天数-应付账款周转天数) 流动性 流动比率(current ratio):流动资产/流动负债 速冻比率(quick ratio):(流动资产-存货)/流动负债 现金比率(Cash ratio):(现金+交易性金融资产)/流动负债 偿债能力 有息负债/净资产 有息负债/总资产 利息保障倍数(EBIT/Interest) 货币资金加上交易性金融资产/有息负债 货币资金/有息负债 估值水平 PE PB PE历史分位数 PB历史分位数 现金流数据 CFO/revenue CFO/average total assets CFO/average total equity CFO/operating income CF0/net income (CFO-perferred dividends)/weighted average number of common shares CFO/total debt(这里采用有息负债) CFO/cash paid for long-term assets(固定资产投资) CFO/cash long-term debt repayment CFO/dividend paid CFO/cash outflows from investing and financing activities (CFO+interest paid+taxes paid)/interest paid 信用水平 Z-score 成长性 营业收入同比 营业利润同比 净利润同比 归母净利润同比 扣非归母净利润同比 CFO同比
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值