【重磅更新】沪深A股上市公司常用数据整理(更新至2022年)方便匹配 提供整理代码

论文常用上市公司数据整理


1、数据格式

dta格式(适用于Stata1
4/Stata15/Stata16/Stata17版本)
需要安装包可以该帖免费
下载:下载地址
提供基础数据包整理代码

2、数据包含

基础数据包:


资产
负债表
利润表
现金流量表(直接法)
现金流量表(间接法)
偿债能力(资产负债率
、流动比率、速动比率、利息保障倍数等)
披露财务指标(基本每股收益、稀释每股收益
等)
比率结构(营运资金比率、固定资产比率、有形资产比率、综合税率等)
经营能力
(总资产周转率、存货周转率、资本密集度、应收账款周转率等)
盈利能力(资产报酬率
、总资产净利润率、净资产收益率、管理费用率、营业毛利率、投资收益率等)
现金流分
析(股权现金流、公司现金流、股权自由现金流、企业自由现金流、折旧摊销等)
风险水
平(财务杠杆、经营杠杆、综合杠杆)
发展能力(营业收入增长率、总资产增长率、净利
润增长率、可持续增长率、资本积累率等)
每股指标(每股收益、每股净资产、每股现金
净流量、每股净资产等)
相对价值指标(托宾Q值、账面市值比、市盈率、市净率等)

股利分配(股利分配率、每股税前现金股利、每股税后现金股利、收益留存率等)
治理综
合信息(股东总数、 员工人数、董事长持股数量、总经理持股比例、董事长与总经理兼任
情况等)
高管人数、持股及薪酬情况(董事人数、独立董事人数、董事监事及高管年薪总
额、董事前三名薪酬总额等)
股东股权集中度(包含第1大、前3大、前5大、前10大
股东持股比例之和以及Herfindahl指数、股权制衡度等)
流通股东股权集中度

审计意见表(审计费用、审计意见类型、审计事务所、审计师)
股本结构(总股本、流
通股本、国有股本、A股股本等)

公司文件
包含特色整理指标:上市年份(便于计算
上市公司年龄或者剔除当年IPO的数据),行业(以证监会2012行业分类标准,制造
业用二级行业分类,其他行业用一级行业分类),市场类型,是否ST或PT(以最新的是
否ST来判断,如果需要根据当年是否ST,可以参考该贴https://bbs.pi
nggu.org/thread-11337253-1-
1.html)

同时
提供基础数据所有变量合并版本


拓展数据包:
个股回报率(周期包括:日、周、月
、年)
市场回报率(周期包括:日、周、月、年)

市场类型字段对应编码:1=上海
A,4=深圳A,16=创业板,32=科创板,64=北交所
综合市场回报率(周期包
括:日、周、月、年)

指数
无风险利率(定期整存整取一年利率)
三因子数据(包
含周期:日、周、月)
四因子数据(包含周期:月)
五因子数据(包含周期:日、周、
月)
股东股权质押统计表和明细(可以筛选控股股东股权质押数据)
个股非流动性Am
ihud指标(日、周、月、年)
个股换手率指标(日、周、月、年)
投资者情绪指数

计算操控性利润和非操控性应计利润计算所需数据
研发支出/研发投入(研发费用  
费用化 资本化)
汇率
交易日历
三会基本信息
股东大会信息文件
委员会召开情况

股权性质(介绍:/thread-1
1489489-1-
1.html)
社会责任报告数据(和讯网)到2020年后续网
站未更新(介绍:/thread-10
602192-1-
1.html)
十大股东、十大流通股东持股比例明细
机构投资者
持股比例(Wind)
分析师预测指标文件
分析师特色指标(是否四大、分析师跟踪人
数、研报关注度、上市公司透明度)
董监高个人特征文件(性别、年龄、学历、职业背景
、海外背景、学术背景、金融背景等) 2022年未更新全,实时更新
高管个人资料文
件(性别、年龄、教育背景、任期等)
董监高任职情况


3、数据说明

精心整理
以便写论文方便
数据起始时间都是公司上市开始到2021年
数据只有沪深北交所A股
上市公司(包括主板、中小板、创业板、科创板),不包含B股上市公司
只有保留年度数
据,报表类型只保留合并报表
所有数据统计证券代码字段为stkcd,年份字段为ye
ar,以便以合并匹配
注意:stkcd字段类型为数字,1即代表股票000001,
为了便于匹配同时提供证券代码字段(字符型)

直接用Stata的merge 
1:1 stkcd year 匹配汇总简直不能更方便
字段都为中文名,直观方便

让您免去数据下载整理的烦恼


4、附件下载(百度网盘地址)


数据说明文

 数据说明文件 (76 Bytes)

基础数据包

拓展数据包


基础+拓展数据

5、示例代码


*=================
======= 合并数据 =========================


use 资产负债表.dta, clear

keep stkcd 证券代码 ye
ar 资产总计 负债合计 货币资金 交易性金融资产

merge 1:1 stk
cd year using 利润表.dta, nogen keep(1 3) k
eepusing(净利润 营业收入)

merge 1:1 stkcd year
 using 盈利能力.dta, nogen keep(1 3) keepusi
ng(行业代码 总资产净利润率ROAB)

merge 1:1 stkcd ye
ar using 发展能力.dta, nogen keep(1 3) keepu
sing(营业收入增长率B)

merge 1:1 stkcd year usi
ng 相对价值指标.dta, nogen keep(1 3) keepusing
(托宾Q值*)

merge 1:1 stkcd year using 治理综合
信息.dta, nogen keep(1 3) keepusing(董事长持股数
量 董事长持股比例 董事长与总经理兼任情况)

merge m:1 stkcd 
using 公司文件.dta, nogen keep(1 3) keepusin
g(行业代码C 上市日期 市场类型 是否ST 是否ST或PT)

*====
==================== 筛选数据 ==============
===========

*= 剔除金融保险行业

drop if rege
xm(行业代码C, "J")

*= 剔除ST或PT类上市公司

drop 
if 是否ST或PT==1

*= 筛选全部A股

* 市场类型字段对应编码
:1=上海A,4=深圳A,16=创业板,32=科创板,64=北证A股市场

ke
ep if inlist(市场类型, 1, 4, 16, 32, 64)


*= 如果要选择创业板的话

* keep if inlist(市场类型, 16
)

* 剔除当年IPO的数据以及上市以前的数据

drop if year
<=real(substr(上市日期, 1, 4))

* 筛选年份

ke
ep if year>=2010 & year<=2022

  
复制代码

经管之家:momingiqmiao7
欢迎关注,分享更多实用的数据
,独家发布,请勿私自转卖,有任何问题在可以帖子下方回复,及时回复
注意:支持经管
之家和QQ购买,其他渠道购买无质量保证和售后保障,批量购买可享优惠


【关注】
【帖子索引2022年】【帖子索引2021年】【使用常见问题】

【点击查看更多帖
子】【Stata软件下载】【Stata免费学习资料】

补充内容
 (2024-5-30 18:19):
【重磅更新】沪深京A股上市公司常用数据整
理[更新至2023年]方便匹配 含代码 1000+变量
https://bbs.
pinggu.org/thread-11801597-1-
1.html
   

下载链接:https://download.csdn.net/download/weixin_45892228/89134444

点击下载:【重磅更新】沪深A股上市公司常用数据整理(更新至2022年)方便匹配 提供整理代码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值