Fama-French 三因子在A股市场的实证研究

Fama-French三因子模型无疑是量化领域最经典的模型之一，该模型的提出是在论文《commom risk factors in returns on bonds and stocks>里，本帖本着学习的精神对其进行了学习，并使用论文中的方法在中国A股市场上进行了实证。\begin{align}E(R(t))=R_f(t)+bE(R_M(t)-R_f(t))+sE(SMB(t))+hE(HML(t))\end{align}

RM−Rf 表示的是市场因子， SMB 表示的是规模(市值)因子， HML 表示账面市值比因子

一.背景

资本资产定价模型（CAPM）问世以后，许多学者对其进行了实证研究，如Black和Scholes（1972）及Fama(1973)的检验证明，对1969年以前的数据而言，资本资产定价模型是有效的，而对之后的数据，却缺乏说服力。在横截面数据里，股票的平均收益和市场 β 相关性很低，因而更多影响股票收益的因素亟待发掘。

Fama和French(1992)研究了市场 β , 市值(size), 账面市值比(book-to-market equity),财务杠杆(leverage) 和市盈率(E/P)对平均收益的影响。横截面回归后发现，在独立检验四者对平均收益的影响时，四者都表现出了很强的解释能力，而 β 很弱；在进行多变量回归时，市值和账面市值比这两个因子吸收了另两个因子的解释能力，成为了解释平均收益的决定性变量

1993年，Fama和French的论文《commom risk factors in returns on bonds and stocks〉正式标志着三因子模型的建立。在该论文里，他们不仅研究了影响股票收益的因子模型，还研究了对债券收益的因子模型；更重要的是，不同于以往的横截面回归，该论文使用了Black,Jensen和Scholes的时间序列回归方法，对影响股票收益的市场超额收益，规模和账面市值比三个因子进行了实证研究。

下面，本帖就论文里对股票三因子模型的研究思路，在优矿平台上对中证800成分股从2007.6到2016.5的数据进行了实证研究，以验证三因子模型的有效性。

二.研究思路

1.Black-Jensen-Scholes时间序列回归

横截面回归大家都非常熟悉，无论是单变量还是多变量回归，都是在研究解释变量对响应变量的解释能力。Black-Jensen-Scholes时间序列回归的方法是Black,Jensen和Scholes所提出来验证CAPM的。早期的验证方法是先使用一个单只股票的时间序列回归估计贝塔，再用横截面回归验证CAPM推出的假设。但是这样回归会有误差项存在相关性，贝塔非平稳等问题，时间序列回归则避免了这些问题。即根据前一期估计的贝塔值对股票排序再进行分组，分别估计各投资组合的阿尔法和贝塔，每五年重新估计贝塔，然后检验各个投资组合的阿尔法是否显著为0,从而验证CAPM\begin{align}E(R(t))=R_f(t) +\beta(E(R_M(t))-R_f(t))\end{align}

2.解释变量

解释变量就是我们需要验证的三个因子，市场超额收益，规模和账面市值比。我们要按照论文里的思路对其进行处理。

1）分组

把股票按每年5月末时的市值（size）大小进行排序，按照50%分位值把股票分为S(small)和B(big)两组；

再依据5月末时的账面市值比（我们取1/PB）大小对800只股票进行排序，分为L（low，30%）,M(medium,40%),H(high,30%)三组;

再分别对S,B和L,M,H取交集，股票即被分为了SL,SM,SH,BL,BM,BH六组。

也就是说，分组每年5月末进行一次，800只股票每次被重新分为了SL,SM,SH,BL,BM,BH六组，前一年6月到第二年5月重新分组时的投资组合都是一样的

这里为什么要按市值分为两组，按账面市值比分为三组呢？是因为账面市值比有更强的作用，我们要把它分得更细。

(PS:论文里是6月末按照市值大小分组，账面市值比依据的是前一年末时的数据，个人以为5月末也没事)

 
       
     
#定义了一个进行分组的函数get_6groups，方便对每年的数据进行分组
#这里的账面市值比用的是1/PB
import numpy as np
import pandas as pd 
def get_6groups(breakpoint):   #breakpoint是每年进行分组的时间点，这里是每年5月末
    C=DataAPI.MktEqudGet(ticker='000028',beginDate=str(int(breakpoint)-20),endDate=breakpoint,field=u"ticker,tradedate")
    breakpoint=filter(lambda x:x.isdigit(),C.iat[len(C)-1,1])                         #取breakpoint前最近一个交易日日期
    universe = set_universe('000906.ZICN',date=breakpoint)                           #取当时的中证800股指成分股
    ME=DataAPI.MktEqudGet(tradeDate=breakpoint,secID=universe,field=u"ticker,marketValue").dropna()   #取当时的市值
    ME50=np.percentile(ME['marketValue'],50)                                     #算出市值大小的50%分位值
    S=ME[ME['marketValue']<=ME50]['ticker'].tolist()                                #按市值大小分为两组，存为列表
    B=ME[ME['marketValue']>ME50]['ticker'].tolist()
    BP=DataAPI.MktStockFactorsOneDayGet(tradeDate=breakpoint,secID=universe,field=u"ticker,PB").dropna() 
    BP=BP[BP>0].dropna()                                                  #去掉PB值为负的股票
    BP[['PB']]=1/BP[['PB']]                                                #取1/PB，为账面市值比
    BP30=np.percentile(BP['PB'],30)
    BP70=np.percentile(BP['PB'],70)
    L=BP[BP['PB']<=BP30]['ticker'].tolist()                                      #按1/PB大小分为三组
    H=BP[BP['PB']>BP70]['ticker'].tolist()
    M=list(set(BP['ticker'].tolist()).difference(set(L+H)))
    SL=list(set(S).intersection(set(L)))                                       #对S组和L组的股票取交集，作为SL组的股票组合
    SM=list(set(S).intersection(set(M)))
    SH=list(set(S).intersection(set(H)))
    BL=list(set(B).intersection(set(L)))
    BM=list(set(B).intersection(set(M)))
    BH=list(set(B).intersection(set(H)))
    return SL,SM,SH,BL,BM,BH

	MF	SMB	HML
count	108.000000	108.000000	108.000000
mean	0.001237	0.014489	-0.001268
std	0.096189	0.058929	0.049805
min	-0.262845	-0.209948	-0.157205
25%	-0.063134	-0.014343	-0.025673
50%	0.005296	0.014957	-0.004887
75%	0.058838	0.051484	0.022718
max	0.192618	0.214916	0.248741

	MF	SMB	HML
MF	1.000000	0.212499	-0.031912
SMB	0.212499	1.000000	-0.424261
HML	-0.031912	-0.424261	1.000000

	small_BE/ME	1	2	3	big_BE/ME
small_size	12.888889	27.888889	35.777778	41.333333	41.888889
1	25.333333	34.666667	36.777778	34.555556	28.666667
2	39.555556	34.222222	34.444444	25.555556	25.555556
3	44.111111	36.666667	27.333333	28.000000	23.888889
big_size	38.111111	26.222222	25.111111	30.222222	40.000000

	small_BE/ME	1	2	3	big_BE/ME
small_size	6.007957e+10	1.175193e+11	1.455794e+11	1.798913e+11	1.646767e+11
1	1.745471e+11	2.368089e+11	2.355071e+11	2.167016e+11	1.717474e+11
2	3.920921e+11	3.309705e+11	3.278397e+11	2.391956e+11	2.118269e+11
3	7.007655e+11	5.851388e+11	4.300714e+11	4.208436e+11	4.202868e+11
big_size	2.054059e+12	2.041996e+12	2.416426e+12	3.877098e+12	7.510095e+12

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.025433	0.022799	0.043428	0.022999	0.019819
1	0.019233	0.022419	0.023366	0.022356	0.016953
2	0.016595	0.015579	0.017392	0.017074	0.020958
3	0.019433	0.012199	0.014942	0.013659	0.009995
big_size	0.006133	0.000801	0.006065	0.007580	0.005248

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.125990	0.111912	0.216930	0.111223	0.109084
1	0.110347	0.113726	0.110196	0.116036	0.111958
2	0.104115	0.105876	0.110242	0.112561	0.110588
3	0.106525	0.106846	0.107491	0.102590	0.110776
big_size	0.097351	0.097236	0.100561	0.102553	0.092128

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.594353	0.714150	0.350486	0.824708	0.825360
1	0.716048	0.731942	0.791529	0.828343	0.859161
2	0.718364	0.745072	0.884344	0.860049	0.804825
3	0.745227	0.870885	0.906794	0.895085	0.878805
big_size	0.795297	0.894826	0.834521	0.783604	0.786575

	small_BE/ME	1	2	3	big_BE/ME
small_size	1.014500	0.987796	1.341376	1.054965	1.035088
1	0.975273	1.016236	1.023992	1.103041	1.083893
2	0.921680	0.954528	1.082809	1.090298	1.036224
3	0.960486	1.041443	1.069108	1.013754	1.084644
big_size	0.906779	0.960705	0.959496	0.948184	0.853405

	small_BE/ME	1	2	3	big_BE/ME
small_size	12.462385	16.273421	7.562993	22.331745	22.382173
1	16.349394	17.012826	20.061476	22.616582	25.428921
2	16.443012	17.601218	28.469459	25.522643	20.906988
3	17.608419	26.738941	32.113328	30.072274	27.724048
big_size	20.293403	30.030898	23.120656	19.591878	19.765164

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.429206	0.393804	0.121499	0.298528	0.280941
1	0.373788	0.387774	0.291721	0.291967	0.232686
2	0.398290	0.319392	0.222978	0.207927	0.249022
3	0.242946	0.190158	0.152270	0.161753	0.129395
big_size	0.116128	0.005802	0.004471	0.062431	0.124630

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.850504	0.932359	0.401501	0.952128	0.942172
1	0.928505	0.947654	0.928649	0.949936	0.943393
2	0.960149	0.924252	0.962277	0.926240	0.903547
3	0.916107	0.945470	0.944791	0.933945	0.924949
big_size	0.932492	0.929273	0.901979	0.933192	0.942885

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.024177	0.021577	0.041768	0.021694	0.018538
1	0.018026	0.021162	0.022099	0.020991	0.015612
2	0.015455	0.014398	0.016052	0.015725	0.019676
3	0.018244	0.010911	0.013619	0.012405	0.008653
big_size	0.005011	-0.000388	0.004878	0.006406	0.004192

	small_BE/ME	1	2	3	big_BE/ME
small_size	3.101816	3.712481	2.459500	4.795915	4.186454
1	3.156042	3.699929	4.521662	4.495019	3.825185
2	2.879519	2.772733	4.407769	3.844395	4.145978
3	3.493139	2.925629	4.272353	3.843262	2.309965
big_size	1.171278	-0.126530	1.227596	1.382485	1.013901

Fama-French 三因子模型在A股市场的实证研究

Fama-French 三因子在A股市场的实证研究

一.背景

二.研究思路

1.Black-Jensen-Scholes时间序列回归

2.解释变量

1）分组

2）因子

3. 响应变量

三.回归和结果

1.回归一

2.回归二

3.回归三

4.回归结果分析

四.总结