2021年第二届“大湾区杯”粤港澳金融建模竞赛B题解题思路和部分代码

概要:

金融建模类的竞赛难度真的很大,其数据处理程度堪比大数据类比赛;其建模能力要求堪比深圳杯,编程能力要求堪比含金量普通或中上的算法比赛。还需要有及其扎实的金融知识背景(没错,我不会。我就一计算机专业的)。**此比赛不推荐单人参赛、不推荐建模小白参赛。**这次博主单人完成的作品是B题的本科组三等奖。

使用的编程语言和工具:PYTHON,MATLAB,聚宽量化平台
关键词:特征工程 多因子选股模型 BP神经网络 历史数据法

题目回顾:

首先,这个金融建模的题目就已经吊打国内大部分数学建模比赛了,8天的比赛。B题光题目打印出来就整整3页。A题更多。。
概括来说,B题的问题是这样的:
券商研报(卖方研报)是指证券公司的研究人员对证券及相关产品的价值, 戒者影响其市场价格的因素迚行分析,所作出的研究报告。完整的券商研报,包含对证券迚行综合分析,总结出关于上市公司、行业戒宏观政策的看法,并对相关股票迚行投资评级等。
商提供的典型公司研报可能会包括:公司的相关数据、经营情况、重大事件、重要信息,以及关于公司的盈利预测与投资建议,公司的财务预测数据、估值结果与风险提示等。还可能会给出相关报告评级、历史推荐等级和目标价等。
综合研究券商研报和外部环境对证券公司股票走势的影响,请建立数学模型完成下列仸务:
(1)请在湾区指数的 30 支股票中,选取 10 支湾区股票的券商研报,提取研报的特征指标。
(2)对选择的 10 支湾区指数股票,建模分析研报特征指标对股票走势的影响, 并提出明确的投资策略。
(3)建模研究突发事件的闪现、舆情和自然灾害因素等对选择的 10 支湾区指数股票行情的影响。
(4)综合建模分析券商研报和外界环境因素对证券公司股票走势的影响,修改仸务(2)的投资策略,并提出新的投资策略。

说实话,8天8夜的比赛,我花了3天研究题目。导致后期发力不足直接投资策略直接放到上证上跑的效果不是很好。

咳咳,下面是解题思路了!

解题思路:

问题一:

问题一要求在题目提供的30支股票中,选取10支股票并对它们各自的研报进行特征指标的提取。首先,鉴于研究券商研报对股票走势的影响的合理性以及后续模型建立的普适性,随机选取10支股票,其名称及股票代码分别为:分众传媒(002027)、亿纬锂能(300014)、生益科技(600183)、华侨城A(000069)、中国平安(601318)、瀚蓝环境(600323)、格力电器(000651)、粤水电(002060)、中顺洁柔(002511)、白云山(600332)。其次,对于研报的选取,因为不同证券公司撰写的研报,其对股票研究的侧重点以及对股票走势预测建立、使用的模型也迥然不同。经思考,可得:券商研报的内容可以帮助投资者更好地掌握市场动态,和新闻媒体一样,具有一定的实时性。那么,发布日期最新的研报,其内容和给出的特征指标无疑对后续未来投资策略的制定有着最有代表性的参考意义,因此,选取本文撰写日期(2021年11月2日)之前以上10支股票最新发布的研报为研究对象,进行特征指标的提取。然后,根据题意可知,典型研报可以提供如市盈率、市净率、毛利率等特征因子的信息,但我们不认为这是研报的专属的“特征指标”,一般来说,研报中的词语出现的频率在一定程度上会反映撰写者对该词语的重视程度(“你”,“我”等常用词除外),词语出现的频率越高,说明该词语一定程度上蕴含了更多的撰写者想要表达的信息和思想。综上所述,提出研报的特征指标的定义:
1.特征指标是券商研报中出现一定频率的词语。
2.特征指标也是典型研报可以提供的特征因子。
对研报进行基于特征工程的文本特征提取,获得研报的特征指标。
对研报进行特征提取的代码如下(PYTHON,只给个例子,10支股票都贴出来估计过不了审,研报来源:发现报告)

# coding=utf-8
import jieba
from sklearn.feature_extraction.text import CountVectorizer
def cut_word(text):                                   #进行分词处理
    text = ' '.join ( list ( jieba.cut ( text ) ) )
    return text
def cut_chinese_demo2(data):                              #进行简单的词频统计,粗略地反映研报中最有特征性的词汇

    data_new = []
    for sen in data:
        data_new.append ( cut_word ( sen ) )
    transfer = CountVectorizer ()
    data_final = transfer.fit_transform ( data_new )
    print ( "data_new:\n", data_final.toarray () )
    print ( "特征名字:\n", transfer.get_feature_names () )

data7=["亿纬锂能 (300014)——储能电芯获关键测试突破,持续完善上游布局"
"事件:2021 年前三季度,公司实现营业收入 114.48 亿元,同比增长 114.39%;实现归母净利润 22.16 亿元,同比增长 134.18%;实现基本每股收益 1.17 元/股,同比增长 129.41%。"
"投资要点:业绩略低于市场预期, 累计营收突破百亿大关。2021 年前三季度,公司实现营业收入"
"114.48 亿元,同比增长 114.39%,主要系随着新建产能持续释放,为满足客户需求,公司电池出货规模增长较大所致;实现归母净利润 22.16 亿元,同比增长 134.18%;实现基本每股收益 1.17 元/股,同比增长 129.41%。2021 年第三季度,公司实现归母净利润 7.21 亿元,同比增长 23.70%,环比下降 14.98%;单季度销售毛利率为 21.55%,环比下降 2.4 个百分点,我们认为主要系原材料涨价带来的成本压力所致。"
"国内领先的动力电池厂商,储能电芯获关键测试突破。根据中国汽车动力电池产业创新联盟统计,2021 年 1-9 月,我国动力电池累计装机量为 92.03GWh,其中亿纬锂能装机量为 1.70GWh,市占率为 1.8%,位居国内第七;2021 年 9 月,我国动力电池装机量为15.69GWh,其中亿纬锂能装机量为 0.26GWh,市占率为 1.6%。2021 年 5 月,公司子公司亿纬动力 LF280K 储能电芯获得了祐力(中国)投资有限公司出具的 UL9540A 测试报告,该报告是北美储能项目开发商或业主在提交相关项目审批流程时所需的一份关键第三方报告,本次获得报告有望助力亿纬动力更好地开拓国际储能市场,对扩大产品国际影响力和海外市场业务具有积极作用。"
"相关研究 证券分析师 张雷 A0230519100003 zhanglei@swsresearch.com 研究支持 陈明雨 A0230120040001 chenmy@swsresearch.com 黄华栋 A0230120050002"
"huanghd@swsresearch.com"
"联系人"
"黄华栋(8621)23297818×转"
"huanghd@swsresearch.com"
"0%"
"-50%"
"拟与中科电气设立合资公司,持续完善上游布局。公司拟与中科电气签署《合资经营协议》拟合作设立合资公司,其中公司认缴 40,000 万元,持有合资公司 40%股权;中科电气认缴 60,000 万元,持有合资公司 60%股权。该合资公司将专注于为负极材料制造,并优先向公司及其子公司供应。项目计划投资总额为人民币 25 亿元,负极材料年产能 10 万吨, 采用分期建设模式,一期和二期产能规模各为 5 万吨/年。本次合作有利于公司持续完善上游电池原材料产业链布局,稳定原材料供应,降低采购成本,打造更具技术、成本竞争优势的锂电池产品。"
"维持盈利预测,维持“买入”评级:公司是优质的锂电池科技公司,动力电池快速放量, 储能电池有望形成新的增长曲线。我们预计 21-23 年公司归母净利润分别为 32.20、44.81、"
"57.40 亿元,对应 EPS 分别为 1.70、2.36、3.02 元/股,当前股价对应的 PE 分别为 64 倍46 倍和 36 倍。维持“买入”评级。"
"风险提示:全球电动化进展不达预期;动力电池价格下跌超出预期。财务数据及盈利预测"
"注:“市盈率”是指目前股价除以各年每股收益;“净资产收益率”是指摊薄后归属于母公司所有者的 ROE"
"请务必仔细阅读正文之后的各项信息披露与声明"
"财务摘要"
"百万元,百万股	2019A	2020A	2021E	2022E	2023E"
"营业总收入	6,412	8,162	15,741	22,881	29,238"
"其中:营业收入	6,412	8,162	15,741	22,881	29,238"
"减:营业成本	4,506	5,794	11,350	16,559	21,188"
"减:税金及附加	47	39	75	110	140"
"主营业务利润	1,859	2,329	4,316	6,212	7,910"
"减:销售费用	175	226	441	641	819"
"减:管理费用	189	270	519	686	877"
"减:研发费用	459	684	1,198	1,373	1,462"
"减:财务费用	95	60	95	80	48"
"经营性利润	941	1,089	2,063	3,432	4,704"
"加:信用减值损失(损失以“-”填列)	-89	-82	0	0	0"
"加:资产减值损失(损失以“-”填列)	-86	-22	36	-60	-60"
"加:投资收益及其他	867	944	1,500	1,701	1,900"
  • 9
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

泽楷学量化

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值