##Ricequant米筐金工——因子分析
作者:戴宇、小湖
上一篇介绍了单因子检验是因子分析前重要的一个步骤,是构建因子库、建立因子模型的基础,这篇报告首先对常见估值因子进行初步的检验。
第一篇.估值因子的分析
估值因子是一类具有特色的风格因子,本报告选取了PE,PB,PCF,PS,PEG五个常见的估值因子进行因子分析,测试区间是2014年1月1日~2017年8月1日,测试数据是全市场股票的月数据,主要从有效性和稳定性两个角度分析因子。
通过此次报告可以初步得出以下结论:
1、 此次选择的五个估值类因子的行业分布存在一定相似性,在银行、钢铁行业的暴露度普遍偏低,在通信行业、医药生物行业的估值因子的暴露度较高。
2、 通过观察因子暴露度在不同市值区间的分布差异,估值类因子与市值有轻微的递减关系,说明因子暴露度与市值存在一定关联。
3、 IC和RANK-IC两种计算因子暴露度与收益率相关系数的方式有差异,RANK-IC的显著性水平较低(p值较低),RANK-IC的绝对值较大,在时间序列上波动性较大。
4、 PE因子暴露度与收益率的负相关性的关系较明显,并且这种趋势持续时间较长,peg因子显著的状态切换比例和同向比例均较大,说明大部分情况下peg因子的相关系数较显著,但是难以判断peg因子与收益率关系的方向。
5、 所选估值因子中PE、PCF、PEG的同向显著比例普遍比状态切换显著比例大,说明在这三个因子最近一年存在趋势性。
6、 所选估值因子的负相关显著比例比正相关显著比例高,在最近一年的IC和RANK-IC的6月移动平均值都小于零,并且在负半轴上的绝对值有增大的趋势,说明在最近一年估值因子暴露度与因子收益率的大部分时间可能存在负相关关系。
7、 PB、PEG因子的IC分布直方图处于小于零的部分大于大于零的部分。
大类因子 | 具体因子 | |
---|---|---|
估值因子 | PB | |
估值因子 | PE | 市盈率,公司当时股价与每股盈利的比率,股价一般以最新收盘价 |
估值因子 | PEG | |
估值因子 | PS | |
估值因子 | PCF | |
一、因子暴露度在不同行业的分布差异:
因子在行业之间的平均暴露度存在差距,以2017年8月1日为例。
图1到5展示了因子暴露度在不同行业的分布差异通过对比各个因子暴露度的行业分布差异,银行行业平均暴露度最小的因子有PCF,PE,PB。各个因子在钢铁行业的平均暴露度均较小,在通信行业的平均暴露度都比较大。图1展示了PB因子在食品饮料行业的平均暴露度最大,在钢铁、银行行业的平均暴露度最小。
图2展示了PE因子在通信行业的平均暴露度最大,在银行行业的平均暴露度最小
图3展示了PEG因子在一些综合性的股票中平均暴露度较大,在电气设备行业的平均暴露度最大,在钢铁行业的平均暴露度最小。
图4展示了PS因子在休闲服务行业的平均暴露度最大,在钢铁行业的平均暴露度最小。
图5展示了PCF因子在通信行业的平均暴露度最大,在银行行业的平均暴露度最小。
4.1.3 IC/RANK-IC相关的自定义比例指标
一般而言,市场风格不是一层不变的,而是轮动的,所以所求的IC或者RANK_IC的相关系数会存在符号上的切换,所以在选择因子的时候,一般是计算相关系数正负的比例,选择相关比例较高的一个方向作为因子在未来的预测方向。这里选择了正相关显著比例、负相关显著比例、同向显著比例和状态切换比例作为衡量因子方向的指标。
指标的相关定义如下:
显著:是指相关系数的显著性水平小于一定阈值的样本。正相关显著比例:显著的正相关系数占样本的比例负相关显著比例:显著的负相关系数占样本的比例状态切换显著比例:前后两期中相关系数符号相反占样本的比例。同向显著比例:前后两期中相关系数符号相同占样本的比例。所以:假如同向显著比例占上风,则意味着该段时间内因子的风格延续性较强,可以使用动态权重来调整因子的权重;同理,如果状态切换比例占上风,对于因子的赋权应该使用静态权重。
以最近一年时间即2016年8月1日到2017年8月1日的因子数据为研究对象
图43、44展示了PE,PEG,PCF,PB,PS五个因子的IC显著的状态切换比例,同向显著比例,负相关比例,正相关比例。可以看出PE因子的IC同向显著比例较高,并且IC负相关显著比例高,说明PE因子暴露度与收益率可能存在负相关关系,并且这种关系可能持续下去。此次报告衡量因子是否显著的标准有两个条件
1、相关系数的正负显著比例至少有一项大于阈值A,
2、相关系数的正负显著比例之和大于阈值B,
此次报告中阈值A = 0.35,阈值B= 0.6
因子是否具有趋势性:
因子具有趋势性:同向显著比例大于显著状态切换比例
表3 IC/RANK-IC相关的趋势/显著指标
指标 | pe | pb | pcf | ps | peg |
---|---|---|---|---|---|
pearson相关比例是否显著 | 负相关比例显著 | 正负相关比例均不显著 | 正负相关比例均不显著 | 负相关比例显著 | 正负相关比例均不显著 |
pearson正负相关比例之和是否显著 | False | False | False | False | False |
pearson_趋势性 | True | False | True | False | True |
spearmanr相关比例是否显著 | 负相关比例显著 | 负相关比例显著 | 负相关比例显著 | 负相关比例显著 | 负相关比例显著 |
spearmanr正负相关比例之和是否显著 | True | False | False | True | False |
spearmanr_趋势性 | True | False | True | True | True |
4.2收益率分析
图45展示了PB因子第四组分组收益累计最高,其他几组之间没有显著差异,并且这种差异是从2016年开始显现出来的,说明最近一年的暴露度和收益的相关关系可能出现反转。观察PB因子的IC时间序列图也可以看出IC在2016年开始转为正值。
图46展示了PCF可以看出在牛市第一组和第四组因子组合可以获得快速上涨的收益,而第三组表现最差。通过对比IC和RANK-IC的时间序列在2015年移动均值的绝对值有减小的趋势,说明暴露度和收益率的相关系数出现波动,也说明了PCF的稳定性减弱。
图47展示了PE因子的第一组和第三组累计收益较高,两者之间没有显著差异,这种差异从2015年开始显现出来,RANK-IC时间序列的移动平均值从2015年之后大部分处于小于零的部分,说明第一、三组和其他几组的累计收益的差异有可能扩大。
图48展示了PEG的因子累计收益其他几组没有显著差异,第4组表现较差。
图49展示了PS因子第三组累计收益最低,并且这种差异从2015年开始; IC和RANK-IC的移动平均值在2015年位于零值附近波动,说明因子暴露度和收益率之间没有固定的相关方向,PS因子在牛市和股灾期间的稳定性较差。
综上所述PB、PS、PE、PEG、PCF因子暴露度与收益没有线性关系。
通过上面的分析可以得出以下结论:
1、 此次所选的五个因子与收益率在长期上都存在负相关关系
2、 在时间序列上,PEG因子的暴露度相对其他因子较为稳定,在近一年表现出较强的趋势性
3、 PE因子的负相关性比较显著,并且有一定的趋势性,通过观察RANK-IC的同向显著比例和负相关显著比例,PE因子可能比其他因子更加有负向的趋势性,稳定性更好
4、 PB因子的分布有明显的左偏,并且分布比较规范,但是稳定性表现一般。
5、 PCF、PS因子近期的稳定性和有效性表现一般