“统计盛典”中国R语言大会主会场冯永昌演讲全文丨“阿尔法因子”是个谎言?三类因子模型的逻辑和实证

金融 kingmo888 969℃ 0评论
时间:2016年5月27日 下午
地点:人民大学世纪馆
演讲者:冯永昌博士
演讲正文:

冯永昌:

大家好!我今天分享的题目还是量化投资,可能在座的很多朋友都听过我的讲座,包括媒体观点。原本量化投资是一个比较小众的行业,虽然相关的学科很多,但是过去做量化的并不是很多。去年年中的一波股市大幅下挫,使得量化投资处在了风口浪尖。今天中午我听到了一个振奋人心的消息,程序化交易管理办法要暂缓发布了,至于品种能不能放开还需要看,但至少情况是在朝有利于量化的方向发展。
 我今天讲的题目比较具体,主要是阿尔法投资的因子模型。报告总共分四个部分,第一个对对量化投资做一个简介,第二个介绍一下阿尔法投资,第三个讲因子介绍,第四个给大家讲讲什么是因子模型。
 首先我们说说什么是量化投资。很多人说量化很小众,我给大家说虽然过去很小众,但是随着私募管理人牌照的放开,在中国基金业协会备案的基金已经超过一万多家了。这里面有三分之一是纯做VC和PE的剔除掉,二级市场的私募里纯做量化的不到20%,但是不用量化的基本没有,实际上涉及量化的私募基金据我统计是五千家以上,资金量也是万亿级别了。常见的量化策略主要是阿尔法套利和CTA,剩下还有一些高频交易和算法交易,以及某些特定的套利交易。
 我们今天主要讲一下阿尔法投资,下面看看阿尔法投资的收益情况。由于二级市场私募基金的净值并不要求强制披露,所以我们尽可能的在网上进行抓取、汇总后大致可以得到阿尔法的年化收益率20%多,年化波动率16%,最大回撤8%。这里要说明下,年化波动16%是非常低的,非常难以做到的。我周围做得比较好阿尔法产品在2010年-2015年间,可以做到50亿以上的规模,20%以上的年化收益以及3%以内的最大回撤,这是一个非常惊人的业绩。阿尔法投资是量化投资里面最核心的一种方法,其他任何一种量化投资方法都不可能管理这么大的规模,也不可能有这么大规模调整后的收益率。我们关注阿尔法还有另外一个重要的原因,其他所有的策略涉及的学术基础并没有那么复杂,但是如果想把阿尔法研究透了,统计学、计量经济学、金融学、投资学和优化等学科都要学的特别好。最后说一句,量化投资不一定非要程序化交易,只要交易决策阶段用模型去计算的就是量化投资。

量化投资为什么能赚到钱呢?因为量化投资的收益主要来源于波动。为什么有波动呢?因为大家对价格看法有分歧。波动大概可以分为三类:赚绝对波动的策略、赚相对波动的策略、还有赚交易性波动的策略。另外在量化投资里其实风险不是很重要,单位风险的收益率才重要,一切优化针对的都是单位风险的收益率。另外一个重要的点是胜率和赔率,今天讲的阿尔法胜率很高,赔率很低,明天讲的CTA胜率很低但是赔率很高,但是都能赚到钱。胜率和赔率决定了量化策略最终的效果,但是不同的量化策略的特征不同。

 另外我们再讲一个概念,很多人认为量化投资可以预测市场涨跌,但是我认为没有什么东西可以预测市场涨跌的,没有任何一个能赚钱的量化门类是去预测市场涨跌的,价格涨跌不可预测也不需要去预测。单个策略没有办法保证不赔,只有分散才是唯一免费的午餐。
 下面我们看看什么是阿尔法套利。相对波动是不同标的价格之间的相对价格走势,阿尔法套利是由统计学规律驱动的相对波动。配对交易也是一种做阿尔法的方法,但是在国内并不主流,主要因为标的证券的可融种类比较少,可融数量也比较少。百亿以上规模的基金最主要的做法则是做阿尔法套利,即做多一揽子股票做空股指期货,原因是认为选的股票比大盘好。方法论中的阿尔法则分几种,CAPM中的阿尔法是对大盘指数一元回归后的截距项,有些基金则选取投资基准进行回归,多因素模型则是利用更多的风险因素去解释股票收益。

 下面还有一个问题,我们如何找到有阿尔法的股票呢?我们简单介绍一种业内常用的方法。假如我们观察到股票收益具有“动量效应”,即涨得好的股票未来涨得更好。对于过去涨得好得有一个界定,比如过去60天涨得好还是过去180天涨得好。另外对股票池、后验区间、调仓周期、组合股票数目、股票权重方案这些定好了之后就可以去回测、验证这个因子是否可以获得超额收益,是否具有阿尔法。比如我们随机选取一个动量因子,用过去60日的累计收益率计算收益率,股票池选取中证300成分股,后验时间为2010年1月1日-2015年6月30日,调仓频率为20个交易日,股票支数为100支,用IF股指期货进行金额对冲,可以测出下面一组结果。

可以看出来这个因子测试的效果很一般,当然这是随机挑选和定义的因子,其表现低于阿尔法基金的行业水平不足为怪。

做阿尔法投资当然需要不止一个阿尔法因子,它需要一个很多个因子组成的阿尔法因子体系,包括基本面、交易面、消息面等各方面。这也是过去数十年充斥在卖方研报里的所谓的寻找阿尔法因子,但其实这套方法不是特别管用。我做了很多年研究后才发现事实上阿尔法因子并不存在,那么阿尔法来自于哪里呢?阿尔法来自于所承担的风险,也就是风险因素。风险因素就是股票在对冲掉大盘之后的差值可以被一定的因素解释掉。这就是我们下面要讲的Macroeconomic多因素模型。

 Macro多因素模型是多元回归方程,有几个学科在研究这个模型,i是对应股票,t是对应时间,bate和F都有个下标,F是以一个因素,有它自己的取值,是时变的。如果F可以构造出来,就是风险因子在t时刻的风险补偿,又叫风险因子。通过寻找它们来获知股票收益是受什么因素影响,这个方法大概在73年的时候Fama教授认为CAPM模型是无法解释截距项的,他用了20年的时间验证还有size和value,估值和规模,又用了20年找到盈利和投资风格进一步解释。寻找风险因子的目的是发现股票收益和哪些因素有关系,这个关系就是风险因子,有了他们就可以估计风险暴露度。普遍认为一个股票的收益是从该股票所承担的风险单位数以及每单位风险对应的风险补偿给出的回报收益率。以此可看,alpha是个伪概念,要是可以事先知道F的走势,做对了就可以获得alpha,做错了就没有alpha。也就是构建完投资组合后,还需要确定组合在每个风险上的暴露有多大,在做优化的时候,可以把暴露变为0。比如估值,市场上会有成长股和蓝筹股的切换,如果可以把估值优化为0,那么组合就和这个切换无关了。不过,也不能全优化为0,因为,优化后总会有与股票池有关的残留项,而且,全优化为0后,组合也就没有什么收益了。怎么选择风险模型靠的是对市场的研判。
早期我做zscore模型时,我一直疑问,桥水基金作为世界上最大的alpha基金,为什么老板却天天发表宏观市场看法,之后我终于明白了,他们是为了判断究竟要在宏观因素上加多大暴露,他只做这一个模型,其他事情就都是模型可以算出来的了。比如,我在去年5月份的时候对size暴露很大,虽然都是300权重股,但是会对中小股权重有所倾斜。6月份的时候我根据09年相似的形态写过一个文章,虽然当时是随便写的,但是恰好说对了,而如果当时我将这个看法加入投资组合指令,把size反向做,value的都对冲成0,行业做成中性,这么做后就可以在股灾中挣到很多钱,因为最后我提高的都是银行股权重,这就很神奇。但前提是对风格和风险有很强的认识,而没有之后的方法论也测不准,系统之后的理论也是极其复杂。对风险的把握对了就获得alpha,错了,就没有。我们不可能只相信zscore验证后就认为小股票就是好,因为小股票好是有代价的,拿着的话在去年7月份千股跌停时期根本扛不住。总而言之,Alpha来自风险预判,风险模型是最重要的,而整个行业的水准还停留在alpha的阶段,我找过很多,但是alpha因子意义不大。对应学术上的fama-french的方法等等,就不一一讲了。
 下一个fundamental模型也非常有名,在1978年的时候伯克利的rosberrg教授认为直接构造风险因子可能会有些问题,他想通过beta直接估风险因子。Macro中的F是看得见的,这里的F是看不见的,这beta是可以看见的,是每只股票中的特征,叫descriptor。在一个完美的数学世界中,这两个模型是等价的。而在现实中,却又不同,78年美国一家公司通过找descripter的放法构建风险因子十分成功,全世界的对冲基金都是他的用户。但是通过descriptor估计F时发现非常复杂,因为你要做变量选择,变量选择是个面板数据,而你却要对所有股票找到一样的变量。但是不同的股票在时间序列上的风险暴露效应是完全不同的。发现在优化中再加入对风险的判断是相当难做的,不再试二次优化,很难解决,而这个公司也是靠着这种技术买专利。优化中主要是计算r方差协方差矩阵,先通过beta的方差协方差矩阵,然后进行F估算,最后决定风险暴露是多少和选出来多少股票。这个步骤能做好就非常不容易了,会有很好的结果。
 最后讲一个实例,基于学术研究,如今我们又在实践中构建了几个风险因子,技术面是动量,成交量,波动率,效率和强度,注意这不是用来选股的技术指标,而是风险因素,用来衡量市场中的风险,涉及到了正交的处理。宏观上,我们构建了货币增长和货币供应。行业方面采用聚类方法构建了新的行业,因为基于A股中常用的23个行业分类是比较粗糙的,处理后的行业在优化中有很好的效果。

 这里有一个实际的例子,这里选出了几个因子来做,在过去的积累中挑选了ADX,RC和集散量指标构建因子,通过zscore选了100只股票,等权重做了个组合。蓝线就是净值,年化收益5%,波动有17%。这里说下为什么从沪深300中选,因为相比于中证500,300包含蓝筹股,受基本面驱动因素比较多,他们对估值和规模的指标非常敏感,可以解释收益率,而中证500中有很多题材股。我们再看红线,他俩的股票池是一样的,但是我控制了几个风险,在这几个风险的暴露为0,调整后,瞬间他们的年化收益就是14.7%了,年化波动也是20%。

这里有一个很大的提升,但也是冰山一角。如果只是单纯的通过选股进行等权重组合,它的业绩会极不稳定,而对风险进行调整后就有了显著的提高。但是真正极致的组合还是要用国外的方法,进行进一步研究,有两个教授做了20几年,在这上边也有很多论著。希望可以给大家传输一个概念,对于行业来说,alpha因子其实完全没有用,只有风险因子才有用,这是一个比较重要的点。去年有幸跟北大光华做了一个学术合作给国内的FAMA5因子模型做了一个严谨的学术分析,结果非常有用,同行中也在传播。后来也弄了一个技术因子,来通过风险暴露的调整,确定一个研究方向。

 总结来说,alpha模型胜率很高,赔率很低。另外alpha不是用来选股票。而是用来估模型,作为解释变量,去把模型的解释能力提高。这些模型的统计味道非常浓,在国外做的也都是统计,计量经济学家,在国外的对冲基金60%-70%的钱都是由这套方法管理的。以上就是关于alpha和我今天报告的主要内容。

转载请注明:Python量化投资 » “统计盛典”中国R语言大会主会场冯永昌演讲全文丨“阿尔法因子”是个谎言?三类因子模型的逻辑和实证

喜欢 (0)or分享 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址