另类数据与分析师盈利预测

发布时间：2023-04-11 | 来源: 川总写量化

作者：石川

摘要：另类数据的广泛使用提高了分析师短期盈利预测的准确性。然而分析师的精力是有限的，因此另类数据的使用也并非不是没有代价。一进一出，分析师盈利预测准确性的期限结构也悄然发生变化。

特别致谢：本文中针对 A 股的精彩实证得益于朝阳永续在数据和研究方面的大力支持，特此说明并感谢。如果没有针对 A 股的实证，本文将会逊色不少。

另类数据是近年来金融领域研究和实践的重点。然而，另类数据的丰富是否提高了金融预测的质量呢？如果从发表在顶刊上的关于股票预期收益率的实证文章来看，这个问题的答案似乎是肯定的。但是如果我们希望从另外一个视角来审视，即另类数据的使用如何影响卖方分析师关于上市公司盈利预测的准确度，那么这个问题的答案又是什么呢？

这便是 Dessaint, Foucault, and Fresard (2022) 的内容。这篇文章理论简明、实证清晰，然而却研究了一个之前很少有人考虑的角度，让人看完眼前一亮。该文的出发点是系统审视另类数据在金融预测方面的应用。通过梳理 26 篇相关学术论文（使用的另类数据包括社交媒体、卫星数据、搜索引擎数据等），该文发现这些另类数据的预测时间尺度均不超过 1 年。换句话说，这些另类数据是 short-term oriented data，只能对短期的预测提供信息增量。

在这个前提下，一系列问题自然而然地浮出水面：估值模型中同时需要短期和长期的盈利预测作为 input，那么大量具备短期预测信息的另类数据的涌现对于分析师不同时间尺度（短期 vs 长期）的盈利预测结果会有怎样的影响？不同尺度上的综合影响又是否能够提高整体的预测质量呢？在另类数据愈加普及的今天，回答这些问题对于使用分析师盈利预测信息至关重要。

就上述问题，Dessaint, Foucault, and Fresard (2022) 通过理论和实证给出了精彩的论述。在理论模型（of course 有 math！只不过我们还是通过文字描述一下吧）方面，该文假设分析师在进行盈利预测时，需要最优地分配其投入到不同时间尺度预测的精力，从而最小化预测误差以及获取不同时间尺度预测信息的成本这二者之和。另类数据的出现降低了获取短期预测数据的成本，并同时提高了短期预测数据的准确度。因此，它促使分析师将更多的精力投入到获取和分析短期预测信息上，以此来提高短期预测的准确度。然而顾此失彼，由于分析师的精力是有限的，这造成的后果是降低了他们长期预测的准确度。

在实证方面，该文使用美股分析师的盈利预测数据对上述理论模型进行了检验。而该文最重要的一张图就是该文的 Figure III：分析师盈利预测准确度的期限结构（term structure）。我们先来说其中的 Panel A。

图中曲线之所以被称为 term structure 是因为图中横坐标是预测的时间尺度（horizon，即分析师发布盈利预测到公司财报正式披露之间的时间之差，也即预测的时间尺度），而图中的纵坐标是分析师平均预测准确度。预测准确度的计算方法如下。对于给定的日期 $t$ 、分析师 $i$ 以及时间尺度 $h$ ，获取该分析师所做的全部盈利预测（假设一共有 $j = 1,\cdots,J$ 个），对应找到事后实际的财报中的盈利，然后在截面上将经总资产标准化后的实际盈利对同样标准化后的盈利预测回归：

$\displaystyle\frac{\mbox{Earnings}_{jh}}{\mbox{Assets}_j} = \alpha + \beta\frac{\mbox{Forecasts}_{jh}}{\mbox{Assets}_j} + e_{jh}$

最终，以上述截面回归的 R-squared 作为日期 $t$ 、分析师 $i$ 、时间尺度 $h$ 下的预测准确度；然后，对于给定的时间尺度，在时间以及分析师两个维度同时聚合，获得该 $h$ 下全部 R-squared 均值，以此表示时间尺度 $h$ 下的分析师预测准确度水平。而上图所绘的正是 R-squared 均值如何随 $h$ 变化。图中曲线清晰的表明，分析师盈利预测准确度随预测时间尺度递减（图中灰色区域为置信区间）。这似乎是在意料之中，而且也和另类数据关系不大。但之所以铺垫它，是为了更好的解读 Panel B，它诠释了该文的核心。

图中的蓝色曲线是使用 1983 到 1999 年之间的数据构造的 term structure；红色曲线是使用 2000 到 2017 年之间的数据构造的 term structure。两条曲线传递出的信息是：红色曲线的斜率比蓝色曲线斜率更加陡峭，说明进入 2000 年之后（即另类数据逐渐开始在美股上崭露头角之后）短时间尺度上预测准确度增加，而其代价是长时间尺度上预测准确度下降。

为了更好的说明这一点，下图分别逐年绘制了短期预测（小于一年）的平均准确度以及长期预测（超过两年）的平均准确度。图中清晰的展示出，短期预测的平均准确度呈上行趋势，而长期预测的平均准确度则呈下行趋势。

需要说明的是，虽然预测准确性的 term structure 随着另类数据的普及变得更加陡峭（短期预测准确性上升、长期预测准确性降低），但是该结果并不能直接证实二者的联系。为此，Dessaint, Foucault, and Fresard (2022) 考察了不同行业 term structure 随时间的变化趋势与另类数据的使用关系。回归结果显示，另类数据使用越多的行业，term structure 变得更加陡峭，从而说明了另类数据的使用以及长短期预测准确度变化差异二者之间的联系。以上简要介绍了 Dessaint, Foucault, and Fresard (2022) 的核心结果。下面马上来看看 A 股的分析师盈利预测又如何。

使用朝阳永续的分析师预测数据（时间跨度为 2012 到 2023，共 4208520 个样本），我们（基本）复现了 Dessaint, Foucault, and Fresard (2022) 的 term structure（及其变化）。由于没有 A 股分析师使用另类数据的具体情况，我们的实证主要聚焦于 term structure 部分及其随时间的变化。另外，实证部分针对 A 股的实际情况也做了相应的调整。

首先，Dessaint, Foucault, and Fresard (2022) 在每个日期 $t$ 、分析师 $i$ 以及时间尺度 $h$ 的组合下进行截面回归，然后再从时间和分析师两个维度聚合到时间尺度 $h$ 下，计算平均 R-squared。在 A 股中，在如此粒度的切割下，对于给定的 $t$ 、 $i$ 以及 $h$ 组合，无法产生足够的样本进行截面回归。因此我们先在分析师层面进行一次聚合，然后将给定 $t$ 和 $h$ 组合下的全部样本进行截面回归，得到 R-squared 之后再聚合时间维度，最终得到给定 $h$ 下的平均信息准确度。此外，不难发现， $h$ 取值的粒度也将决定每次截面回归时样本数的多寡。本文汇报的结果中，其取值粒度为月份，即将盈利预测发布时间和实际财报发布时间之间的差距映射到月。例如， $h=1$ 表示盈利预测和财报发布之间的时间区间在 0 到 1 个月之间。

下表展示了 $t = 2022/11/1$ 、 $h = 4$ 时的分析师预测样本。

另外一个差异是 $h$ 的取值范围。从原文可知，美股中 $h$ 的跨度到 60 个月。而 A 股实证中这个跨度是 1 到 36 个月。由于超过 36 个月的样本个数太少，因此我们将其排除在考虑范围之内。下面就来看实证结果。首先是整个实证区间内的 term structure（对应原文 Figure III，Panel A）。和美股上的结果一致，A 股分析师盈利预测的准确性也随着预测时间尺度而递减。不过有意思的是，当预测时间尺度很短（即 $h$ 取值很小）时，A 股分析师的预测准确性要高于美股分析师。例如，当 $h=1$ 时，A 股分析师预测准确度超过 90%，而美股分析师的预测准确度则不到 90%。（稍后会简要讨论这个问题。）

接下来，我们看看能否复现原文的 Figure III, Panel B。为此，以 2016 年为分界将分析师盈利预测样本分成前后两个区间，然后分别计算并绘制这两个区间内分析师盈利预测准确度的 term structure，结果如下。从图中可知，后一个区间内的短期预测准确度确有提升（和美股一致），另外有意思的现象是在跨度为 1 - 2 年（12 到 24 个月）的预测尺度上，第二个区间内的准确度较第一个区间显著降低。不过和美股不同的是，在大于 2 年的预测尺度上，两个区间内的结果并无显著差异。

在进一步讨论结论之前，我们再尝试复现原文 Figure IV，即逐年计算短期预测（以 $h < 12$ 个月的全部预测为代表）和长期预测（以 $h >24$ 个月的全部预测为代表）下 R-squared 的均值。下表汇报了每年的 R-squared 样本数。

接下来，分别用每年 R-squared 均值对时间回归，得到 $h < 12$ 和 $h >24$ 两个情境下各自的回归斜率。之后，统计检验这两个斜率是否相等。下表展示了检验结果，其中同时考虑了 OLS 和 robust regression 的情况（后者中使用 Huber function 及默认参数作为 obj function）。在 OLS 下，检验的 p-value 小于 5%；但当换成 robust regression 时，p-value 却高于 10%，表明两个回归系数的差异并不显著。

下图绘制了逐年 R-squared 均值的散点图以及相应的回归结果。通过回归结果可知，短期预测准确性的斜率为正（说明随时间呈上升趋势）；长期预测准确性的斜率为负（说明随时间呈下降趋势）。然而，由于 A 股分析师盈利预测的时间跨度远不如美股（且也有理由合理地怀疑应用另类数据的程度也不及美股），因此上述结果是否稳健有待时间的检验（比如，当使用 robust regression 时，两个回归系数的差异在统计上并不显著）。

最后，在结束本文实证之前，再来看看前面遗留的问题：为什么 A 股中短期预测的准确性比美股更高。我们对此的猜想是分析师在上市公司披露了业绩预告或者业绩快报（根据监管要求，前者是有条件强制披露，后者是鼓励披露）之后做出的预测提升了短期准确性。为此，我们挑出在每个财报期发布业绩预告（业绩快报）的上市公司，然后将相应的分析师盈利预测样本划分为早于和晚于业绩预告（业绩快报）两组，并检验这两组在短时间尺度上预测准确性（即 R-squared）是否在统计上显著不同。下表给出了 $h$ 分别取 1，2 以及 3 时的检验结果。

由结果可知，无论是业绩预告还是快报，在其发布后的分析师盈利预测准确性均显著提升。这一结果符合预期，同时也暗示了业绩预告和快报对资产定价的重要性。以上就是针对 A 股的实证结果，希望它们能给你带来些许不一样的启发。再次感谢朝阳永续对实证的全方位支持。

如果你不希望单纯地将另类数据和市场异象研究画等号，那么 Dessaint, Foucault, and Fresard (2022) 应该会让你眼前一亮。因为前者，仅仅是另类数据在资产定价研究中的很小一部分而已。

如何通过另类数据的角度去理解哪些系统性风险驱动资产收益率在时序和截面上的变化？另类数据如何影响各类金融参与者的行为？数据丰富性和资产价格中信息含量之间的动态关系又如何随时间变化？另类数据如何影响投资者学习以及它们是否会进一步导致事后虚假可预测性？……这些问题也许远比挖个 anomaly 重要。

根据作者官网的介绍，Dessaint, Foucault, and Fresard (2022) 是 JF forthcoming，盼它早日见刊。

参考文献

Dessaint, O., T. Foucault, and L. Fresard (2022). Does alternative data improve financial forecasting? The horizon effect. Working paper.

免责声明：入市有风险，投资需谨慎。在任何情况下，本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下，本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外，文中图表均直接或间接来自于相应论文，仅为介绍之用，版权归原作者和期刊所有。

中国·金沙集团1862成色(澳门)入口平台|think tank百科

合格投资者声明

另类数据与分析师盈利预测