1.金融数据库
- CSMAR数据库
CSMAR数据库(China Stock Market & Accounting Research Database)是深圳希施玛数据科技有限公司从学术研究需求出发,借鉴CRSP、COMPUSTAT、TAQ、THOMSON等权威数据库专业标准,并结合中国实际国情开发的经济金融领域的研究型精准数据库。 经过23年的不断积累和完善,CSMAR 数据库已涵盖因子研究、人物特征、绿色经济、股票、公司、海外、资讯、基金、债券、行业、经济、商品期货等19大系列,包含200+个数据库、4000+张表、6万+个字段。
- WRDS数据库
WRDS(Wharton Research Data Service)是沃顿商学院建立的基于互联网的综合数据管理系统,使研究人员能轻而易举地检索源于多种金融、经济和营销数据的信息。WRDS提供的托管数据服务已经成为定量数据研究的核心,被世界各地的学术与财经研究机构公认为业界领先的商业情报研究检索工具。包含的部分数据供应商如下:
- 美国几大交易所都卖合并之前的原始数据,有很多国外订阅源都有TAQ(trade and quote)数据,NASDAQ有ITCH,BATS有PITCH,原始数据包含了交易所当天接到的所有订单,包括每一笔add、cancel、replace、modify、trade、execute,交易所的时间精度都达到了毫秒级,即分时分笔数据,也叫高频交易数据。
2.第三方数据接口
Tushare是一个免费的、开源的财经数据库,可谓是金融业的数据宝库,包含着多方面的数据:股票、指数、基金、期货、债券、外汇、行业大数据,以及提供数字货币行情等区块链数据。这些数据为金融业带来了福音,也为研究人员提供了可靠的参考。Tushare里面的基础数据都是免费共享的,Tushare采用积分分享模式,不同的板块包含不同的数据,从而也需要不同的积分。Tushare 旧版官网:http://tushare.org/index.html;Tushare 新版官网:https://tushare.pro
3.部分开源数据
- 国外有一个限价订单簿(Limit Order Book)公开数据集,包含5支股票10个连续交易日的数据,是原始数据的下采样。这个数据集创建的目的是为LOB上的机器学习研究提供一个benchmark。该数据源自 NASDAQ OMX Nordic 提供的 ITCH feed,由按时间顺序排列的消息序列组成,用于跟踪和记录特定市场中发生的所有事件。它提供了十个交易日的完整市场历史记录。
数据链接:Dataset - etsin.fairdata.fi
)
论文链接:deepai.org
4.中国证监会行政处罚公开信息
摘取部分中国证监会行政处罚详细内容如下: