Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷
目录1.背景介绍
2.安装Python
3.爬取万得上市公司年报3.1Wind下载公告信息
3.2获得年报地址
4.使用Python抓取PDF年报
5.总结
关于我
1. 背景介绍
蚊子正在进行的研究项目涉及到一个数据无法直接从数据库下载,只能手动从公司年报收集。
经过一番查找,蚊子获知目前能获取上市公司年报的网站或数据库有巨潮资讯网、上交所、深交所、Wind万得等。但是他们均不提供年报批量下载。
听说Python可以爬虫下载年报,蚊子做好了花两三周的时间学习Python的准备。没想到不经意间发现了连享会的公众号文章“Python:爬取上市公司公告-Wind-CSMAR”,大大缩短了蚊子的学习时间,半天就能上手了。
以下是实施步骤:
安装Python
Wind下载公告信息
获得年报地址
使用Python抓取PDF年报
2. 安装Python
蚊子安装的是ANACONDA。安装过程中能打钩的都打钩。运行Jupyter Notebook即可运行Python。
3.爬取Wind上市公司年报
3.1 Wind下载公告信息登录Wind
上方菜单点击“新闻”->“公司公告”->“沪深股票”
点击“高级搜索”标题不包含“摘要”,如果不要ST股,也可以加入关键词“ST”
公司类型选择“年度报告”
所属市场选择“全部A股”
公告日期根据自己的研究需求选择
<