最近在做一些量化的内容,但由于是金融小白,对股市的概念还不太明白,于是做了这样一篇笔记,希望能够记录自己了解的一些概念,如果有错误的地方,还请大家指正。
目录
一、股票预测
我们所说的股票预测,通常预测的是什么,这里有很多种类,之前理解的可能就单纯只是预测一个值,其实不然,他有几类具体的目标,我想从任务定义的角度来介绍。
1.1、回归任务
如果把股票预测看作一个回归任务,我们预测的是一个值,于是就分为:
- 价格预测:在该任务中,我们预测未来某一天或者某个时间点的具体收盘价、开盘价或最低价等有关价格的值。比如说,下周五的收盘价是多少?
- 收益率预测:在该任务中,通常预测未来一周时间的相对涨跌变化,比如预测未来一周的收益率是+5%还是-3%。
1.2、分类任务
许多人也在研究股票的涨跌方向,这对于股票来说可能更直观,如果一只股票涨,那么就买入。
- 如预测未来某个时间段内,股价是上涨还是下跌(方向性判断),这样的话就是会把股票预测任务变成一个具有标签的分类任务。
1.3、风险预测任务
这类任务更关注股票的风险管理任务:
- 波动性预测:预测未来某段时间内股价的波动水平(高波动还是低波动),例如预测未来一周内最大涨幅和跌幅。
- 预测极端价格行为。
二、股票市场
通常在阅读文献时会看到一些实验的数据集是一些代码+数字,如CSI 300,CSI 500 和S&P 500,可能对这些概念还有点模糊,于是这部分想介绍一下这些数字的含义,但在具体介绍之前,需要明确股票市场、指数、板块的概念。
-
股票市场:也就是买卖股票的场所,也是我们说的证券交易所,在中国像是上海证券交易所、深圳证券交易所,北京证券交易所。我们通常所说的A股就是包含上交所和深交所人民币股票。
-
板块:板块市场是针对股票市场说的,可以理解为股票市场的子集(按照行业、特点等分类的一组股票集合),以深交所为例,包含主板、创业板和中小版,但目前主板和中小版已经合并。
-
指数:我们通常看到的CSI 300,CSI 500本质上就是股票市场的指数,指数可以理解为股票市场具有代表性的股票集合。
指数名 市场 说明 上证指数 上交所 深证成指 深交所 创业板指数 深圳创业板 CSI 300 由 沪深交易所 中市值最大、流动性最好的300只股票构成 CSI 500 从沪深A股市场中剔除掉最大300家公司后,挑选中等规模、成长性强的500只股票 所以我们平时看到的数据集针对的都是指数,我们通常会在某一指数的股票下进行实验。
-
三、上市
我们其实平时都能听到公司上市,那么公司上市具体应该怎么理解,在该部分将会详细介绍一下。正式的定义(上市:是企业将股票在证券交易所首次公开发行并向公众投资者出售的过程)。简单的理解就是:公司上市 = 一家公司把自己的股份拿出来,在股票交易所公开卖给公众投资者,从而融资并成为公众公司。
公司正式上市之前需要具有很多前提条件(如具有盈利能力、满足公司规模、财务内控等合规),同时成为了上市公司之后,需要承担很多责任(如需要定期披露、接受兼管、股票交易),当然上市之后也具有很多优势(能够起到融资的作用,卖出股票;提升知名度;提升透明度;吸引人才等等)。
四、股票交易
股票交易的本质是买卖:“你买股票,必须有人卖给你;你卖股票,也必须有人买你的。”股票交易是在证券交易所进行的一种市场化行为,就像菜市场买菜一样,只不过交易的是公司的一部分股份。
价格怎么来的?股票价格是随时变动的,这里涉及到三个概念:
- 当前价/最新价:最近成交的价格
- 买一价:当前愿意出最高价买的人
- 卖一价:当前愿意以最低价卖的人
所以买入股票时通常有两种方式:
- 市价买入:不指定价格,按照市场上最便宜的“卖一价”成交,适合新手。
- 限价买入:你指定价格,只有有人卖这个价才成交。
卖出股票的流程也跟买差不多:首先是股票账户中有该股票,在开盘时间内选择卖出,可以以市价卖出和限价卖出。
股票卖出的时机怎么选择?
- 赚到目标盈利:比如说涨了10%就可以选择卖出止盈
- 公司基本面变差:如业绩下滑,负面新闻等等
- 技术分析信号:比如跌破某个支撑位
- 止损机制:跌了5%就止损,避免大亏
五、股票评估指标
我们在使用各类模型预测股票时,仅仅预测一个股价或者是涨跌,并不能直接告诉我们一个策略好不好,我们需要用一些风险收益的评价指标来衡量,我们的策略赚了多少钱?冒了多大风险?所以需要提到一些评估指标:
5.1、年化收益率
5.1.1 理论介绍
年化收益率(Annualized Return) 是指某项投资在一年时间里的平均回报率。它把不同时间长度的投资收益都“换算”为一年期的收益,方便大家进行横向比较。通俗点说,就是告诉我们:如果你以现在的这笔收益率继续投资一年,大约能赚多少百分比。
计算公式有两类:
如果是直接计算,简单年化收益率(用于持有期少于1年的情况)的计算公式如下:
其中,Total Return代表总共的收益,Principal代表投资本金,Holding Days代表持有的天数。如果是持有期多于一年或者是复利的情况,计算公式如下:
其中,代表最终金额,
代表初始金额,n代表投资年数。
但在实际投资中,我们通常拿到的是日收益率、月收益率等,而我们想知道这个收益如果一直维持下去,一年大概能赚多少——这就涉及到“年化”的换算。
- 从日收益率计算:
- 从月收益率计算:
- 从周收益率计算:
但需要注意的是,年化收益率是一个预期指标,并不代表实际收益一定如此。
5.1.2 实际计算
但在实际我们预测时,可能预测每天都有一个收益率,假设我们有一个月的每日收益率序列,现在想要从这些日收益率中计算出一个年化收益率。
第一个方法是我们将计算这一个月的总收益率,
假设每月收益独立同分布(类似于你预测的这个月可以代表全年),用复利公式将月度收益进行年化:
第二个方法是直接每日收益率年化
第二中方法更准确,适合“已有每日收益率”场景。
5.2、波动率
波动率是衡量资产价格在一定时间内变动幅度的指标,常被用于评估风险。简单说,它反映的是“股价波动有多剧烈”。高波动率 → 股价涨跌大,风险高;低波动率 → 股价变化小,风险低。
计算公式如下:
其中,代表第
天的收益率。
代表第
天的收盘价。同样的,如果通过每日的波动率来计算年化波动率:
5.3 夏普比率
夏普比率是一个用于衡量投资回报相对于其风险的指标。它由著名经济学家William Sharpe提出,表示每承担一单位风险所能获得的超额回报。夏普比率越高,表示投资组合在单位风险下能够获得更好的回报。 计算公式如下:
其中,代表投资组合的年化回报率,
代表无风险利率,
代表投资组合回报的标准差(即风险) 。假设你投资的一个股票基金年化回报率为10%,而同期的无风险利率为3%。此外,基金的年化波动率(标准差)为15%。
那么,夏普比率为0.47.如果夏普比率为0.47,意味着每承受1%的风险,投资者获得了0.47%的超额回报。一般来说,夏普比率大于1被视为良好的回报,超过2则非常优秀。
5.4 最大回撤
最大回撤是指从历史最高点到之后最低点的最大损失。它衡量的是投资组合在一段时间内经历的最大损失幅度。这个指标对于评估投资者在下行市场中可能遭遇的风险尤为重要。
其中,代表历史最高点,
代表历史最低点。
假设你投资的股票基金在某一年内的价格走势如下:
-
1月初,基金的价格为100元(历史最高点)。
-
3月中,基金价格跌至80元(最低点)。
-
4月,基金价格回升至90元。
那么,最大回撤为20%,这意味着在这一年内,投资者最大可能损失了20%的投资额。最大回撤通常用来衡量一个投资组合的抗跌能力,回撤越大,意味着该投资组合在熊市中的表现较差。
六、投资组合
投资组合,是指将资金分配到多个不同的资产上(比如股票、债券、基金、房地产等),以实现收益最大化和风险最小化的目标。这个过程叫做资产配置或组合投资。因为投资是有风险的,单独投资某一只股票或资产,如果它表现不好,可能会亏损。而通过多样化投资,就可以降低“某一只资产表现不佳”带来的整体影响。
关键因素包括:
要素 | 说明 |
资产种类 | 投资组合可以包含股票、债券、ETF、房地产等多种资产 |
权重(占比) | 每种资产在整个组合中占的比例,比如30%股票,70%债券 |
预期收益 | 组合整体希望获得的回报 |
风险(波动性) | 投资组合整体的风险程度,可以通过统计方法衡量 |
例子:
假如有 10万元,打算投资:50%(5万)买 苹果公司(AAPL),股票30%(3万)买 债券,20%(2万)买 黄金ETF。
这个就是一个投资组合。通过分散投资来应对不同资产价格变动的风险:如果股市下跌,黄金可能上涨来对冲风险。债券通常比股票稳健一些,帮助平滑整体回报。
七、模拟股票交易
在阅读一些文献时,我们通常会看到他们通过模拟股票交易(回测)的方式来验证自己的模型效果,也就是用用历史的股票数据来模拟一个策略在过去的表现。
为什么要做回测?就像科学实验一样,不能一上来就用真钱实验。
先用历史数据“试验”策略是否有效,可以让你:
提前发现策略是否有致命缺陷;
看清楚策略是否稳健(是否抗波动);
对未来的实盘操作更有信心。
回测的步骤是什么?以预测收盘价为例。
我要做的事情是,用我训练好的模型去预测历史上的收盘价,然后模拟如果我根据这个预测结果去交易,我能赚多少钱?
- Step1:准备历史数据,这个数据用于模型的预测。
- Step2:模型进行预测,使用你的模型(比如回归模型)预测未来的收盘价,或者涨跌概率。这里有两种常见情况:
方式一:预测价格:模型预测的是下一天(或第T+N天)的收盘价。
方式二:预测涨跌概率或方向(分类)
- Step3:制定交易策略(生成信号):我们不能仅仅根据预测来交易,还要设定买卖规则,例如“如果 model预测涨幅 >= 2%,则买入并持有5天否则不操作”,可以设置以下策略参数:买入条件;卖出条件(比如持有N天、止盈、止损);每次买多少仓位(比如满仓、50%仓位);是否允许多空操作(即做空)
Step4:模拟交易逻辑:从初始资金出发,比如:
初始资金 = ¥100,000
第1次买入某股票10手(1,000股),成交价格是¥100,花费¥100,000
持有5天后,卖出,价格为¥105 → 收益 = ¥5,000
- Step5:评估回测表现:收益率指标可以通过累计收益率和年化收益率计算;风险类指标可以通过最大回撤计算;收益风险比可以通过夏普比率计算,此外还可以计算信息比率、卡玛比率等等。
- Step6:可以通过一些可视化的方式更加直观的展示,净值曲线图、收益率分布图、回撤曲线图等等。
八、交易操作
在股票交易时,需要理解一些名词概念,这里介绍了一些:
8.1 仓位
仓位可以简单理解为:把资金的多少投入到某个资产(比如某只股票)中。具体可以参考下表
仓位类型 | 含义 | 举例 |
全仓 | 把所有的钱都投入了 | 你有10万元,全买了某只股票 |
半仓 | 投入了一半的钱 | 有10万元,只买了5万元股票 |
空仓 | 一分钱也没投入 | 全部资金都在账户里没买股票 |
仓位的调整是投资风险管理的核心策略。例如,如果市场不确定,可能会降低仓位;而市场看涨时,可能加仓。
8.2 多空操作
多空操作是指投资者对市场走势的判断和采取的操作方向。
- 做多:主要是看涨操作,认为未来股价会上涨,就先买入,等价格涨了再卖出赚取差价。举例是你以100元买了某股票,之后涨到120元卖出,赚了20元。
- 做空:主要是看跌操作,认为未来股价会下跌,先“借”股票卖出,然后等价格跌了再买回来还给借出方,赚取差价。先“借”来某股票,以100元卖出,之后股价跌到80元,你再花80元买回来还掉,赚了20元。
8.3 止盈/止损
- 止盈:设置一个盈利目标,达到后就卖出,防止贪心导致错过最佳卖点。
- 止损:设置一个亏损下限,亏到一定程度果断卖出,控制亏损。
8.4 杠杆
用借来的钱放大收益(同时也放大风险)。举例本身有1万元,通过杠杆变成了2万元来操作,涨10%赚2000元,但跌10%亏2000元,相当于亏了20%!
九、总结
对于股票预测的基本概念基本就了解这些了,如有错误,还请指出大家一起学习,后续将会对看到的一些方向的文献进行分享。