Financial Machine Learning

发布时间：2023-07-20 | 来源: 川总写量化

作者：石川

摘要：跟着两位大佬一起洞悉金融机器学习的最新学术前沿。

近日，Bryan Kelly 和修大成两位教授的最新力作 Financial Machine Learning 上线 SSRN。

作为机器学习和实证资产定价交叉领域中你不可能忽视的两个名字，他们二位对金融市场中最新的机器学习文献进行了梳理并提供了该领域研究中的经典范例。该文近 150 页，旨在帮助对机器学习工具感兴趣的金融经济学家、统计学家以及投资从业者了解最新的研究成果，其目录如下（光看目录就足够让人跃跃欲试）。

这篇文章也让我想起了之前和王熙老师翻译的 Nagel 的 Machine Learning in Asset Pricing。毫无疑问，这两篇力作的风格（专业性、严谨性、时效性）都是我非常推崇的，也均是这个交叉领域非常重要的学习资料。为此，今天就来全文翻译 Financial Machine Learning 的第一章。感兴趣的小伙伴请自行下载和阅读原著的其他章节。特别感谢刘洋溢和王熙两位老师提出的宝贵修改建议。

最后，本翻译仅供学习交流使用，禁止一切商业行为，未经授权，禁止转载。

1.1 价格即预测

现代金融市场分析聚焦于如式 (1.1) 所示的关于价格的定义，它源自投资者的一般（跨期）优化条件：

$P_{i,t}=\mathbb{E}[M_{t+1}X_{i,t+1}|\mathcal{I}_t]. ~~~~ (1.1)$

该公式的含义是，资产价格 $P_{i,t}$ 反映了投资者对其未来偿付 $X_{i,t+1}$ 的估值。而投资者对于时间和风险等方面的偏好和经济状况会决定这一偿付如何被折现，在上式中则体现为对 $M_{t+1}$ 的刻画。因此，价格由投资者对于前述对象乘积的条件期望决定，而期望又是基于投资者自身所掌握的信息 $\mathcal{I}_t$ 之上。换句话说，价格即预测 —— 它们反映了投资者关于任意资产经折现后的未来偿付的最优猜测。

在实际中，通过预期收益率或者“折现率”来分析价格十分常见。利用它们和价格的等价关系，我们可以通过 $t$ 时刻的价格将式 (1.1) 标准化，从而得到：

$\mathbb{E}[R_{i,t+1}|\mathcal{I}_t]=\beta_{i,t}\lambda_t,~~~~(1.2)$

其中 $R_{i,t+1}=X_{i,t+1}/P_{i,t}-R_{f,t}$ 表示资产的超额收益率， $R_{f,t}=\mathbb{E}[M_{t+1}|\mathcal{I}_t]^{-1}$ 表示单期无风险收益率， $\beta_{i,t}=\frac{\mbox{Cov}(M_{t+1},R_{i,t+1}|\mathcal{I}_t)}{\mbox{Var}[M_{t+1}|\mathcal{I}_t]}$ 为资产和 $M_{t+1}$ 的协方差（译者注：这里实际就是 $\beta$ （风险暴露）的定义；不过原著中用的是 covariance），而 $\lambda_t=-\frac{\mbox{Var}[M_{t+1}|\mathcal{I}_t]}{\mathbb{E}[M_{t+1}|\mathcal{I}_t]}$ 则表示风险价格。我们既可以通过价格也可以通过收益率来回答所关心的经济学问题。然而出于以下原因，使用收益率在学术文献中更为常见。首先，价格通常不满足平稳性，而收益率则不然。因此，当估计量的统计属性依赖于平稳性假设时，收益率就是更好的选择。第二，资产偿付上的数量级差异会导致资产价格上的数量级差异，然而这样的差异对于分析而言并无实质性影响（译者注：但是研究人员必须意识到并处理这种差异。收益率是可以跨资产进行对比的，而价格则不然）。而收益率则不受偿付数量级差异的影响，因此研究者也就无需额外处理它。

更一般地说，通过对数据同质化处理（译者注：使其具有相同或相似性质）可使数据具有易于处理的变化规律和缩放属性，因此通过收益率来研究市场现象有助于降低研究人员的建模难度。此外，收益率本身也是预测，且关于它们的解释十分清晰且具有很强的实用性。 $\mathbb{E}[R_{i,t+1}|\mathcal{I}_t]$ 描绘了投资者对下一期资产价值增长的预期。正因如此，预期收益率是资产配置决策中的重要输入元素。如果我们能设法找到一个能够很好地描述实际数据的实证模型，那么就能更好地了解市场功能，并同时得到一个改进未来资源配置的工具。这个例子很好地阐释了应用社会科学研究的双重性：一个好的模型既增进了科学理解，又改善了现实世界的决策。

1.2 庞大的信息集

金融研究中的两个特性使它自然而然成为了应用机器学习方法的沃土：（1）庞大的条件信息集和（2）模糊的函数关系（译者注：这里指的是信息和预期收益率之间的潜在关系是未知且复杂的）。由式 (1.1) 可知，资产价格的研究与信息密切相关。金融经济学研究的核心问题包括“市场参与者拥有什么信息以及他们如何使用它？”价格中所反映出的预测由和未来资产偿付（ $X_{i,t+1}$ ）有关的可用信息以及投资者对这些偿付的偏好（ $M_{t+1}$ ）决定。如果价格在所有状态下的运动规律都相同，即偿付和偏好近似满足 I.I.D，那么我们可以从式 (1.1) 中拿掉条件信息集 $\mathcal{I}_{t}$ 。然而，哪怕是毫无经验的投资者，当他们在其在线交易账户中浏览或者阅读最新的华尔街日报时，也注定能够迅速意识到隐藏在市场价格背后的庞大信息。此外，现代资产管理行业的行为范式表明海量信息会影响资产价格的形成：专业管理人（以手动和自动方式）定期研究大量的新闻内容、发布数据和专家预测，以便为他们的投资决策提供信息。

金融市场数据的面板属性使得和价格有关的信息范畴变得更加庞大。对于给定资产来说，其价格在时序上的变化极具研究价值，这对应着面板数据的时序维度。另一方面，在任何一个时点，资产的价格在截面上的差异同样不容忽视，这对应着面板数据的截面维度。市场环境随时间的变化将会以相互关联的方式影响诸多资产。例如，大多数资产在高风险和低风险，或者不同的政策环境下的表现均会出现差异。随着宏观经济条件的变化，资产价格由这些共同影响驱动而发生同步调整。另一方面，不同的资产或者不同组的资产会在截面上出现不同的行为。因此，条件信息不仅仅具有时序性质，而且还具备资产层面的属性。一个好的资产定价模型应能够同时刻画导致资产价格共同变化的共性因素以及驱动资产价格截面差异的资产自身因素（其本身可能是静态或动态的）。对此，Gu, Kelly and Xiu (2020) 指出：

金融行业已经积累出了一份令人震惊的预测指标列表，其中的每个指标都被学者们证明能够预测收益率。文献中报告的资产层面的预测特征有数百个之多，而预测市场整体的宏观经济指标也有数十个之多。

此外，考虑到每项金融经济学研究往往只研究一个或少数几个变量，因此我们可以猜想还有广泛的领域未被触及。例如，直到最近，新闻文本的信息内容才被用来作为经验模型 (1.1) 的输入，因此可以预期该领域以及其他前沿领域还有很大的扩展空间。

1.3 模糊的函数关系

如果资产价格反映对未来偿付的预期，那么预测模型就是研究价格的统计工具。金融市场研究中的传统计量经济学方法（例如 Hansen and Singleton 1982）首先根据理论经济模型为收益率预测模型设定了一个函数形式，然后再估计其参数，以理解在所选择的模型约束内，潜在信息源与所观察到的市场价格之间的关联。然而，我们应该以文献中提出的哪个经济模型为出发点呢？

式 (1.1) 中的一阶条件或“欧拉方程”的表述足够宽泛，使之能够包含各种结构性经济假设。这种通用性是有理由的，因为人们尚未就哪种具体的结构化公式更好达成共识。早期的基于消费的定价模型（译者注：宏观金融模型）在大多数评价标准下均无法匹配市场价格数据（例如 Mehra and Prescott 1985）。如果将衡量成功的标准降的足够低，那么现代结构模型在匹配价格数据方面则表现的要稍好一些（例如 Chen, Dou and Kogan forthcoming），不过这些模型描述的现象通常仅限于少数资产，且评估的结果仅仅是基于样本内数据。

鉴于结构模型难以贴合实证数据，过去二十年的大多数实证研究已选择摒弃结构化假设，转而转向更为灵活的“简化形式”（reduced-form model）或“无套利”框架（译者注：在经济学中，reduced-form model 是指模型的输出只是输入变量的函数，而不直接假设底层经济行为逻辑。换句话说，reduced-form model 寻找输入变量和输出变量之间的统计关系。这与结构模型相反，结构模型试图详细地建立和估计底层的经济行为和机制，甚至结构模型能够实现诸如反事实分析一类的高阶因果推断分析）。虽然关于市场的实证研究通常避免强加具体的经济结构，但它们通常会施加统计结构（例如，以低维多因子模型或其他参数化假设的形式）。然而，即便在简化形式的模型中也有很多统计结构可供选择，因而探索灵活模型是值得的，因为后者可以容纳许多不同的函数形式，并且可以应对不同程度的非线性关系以及变量之间的交互作用。

这就是诸如核方法、惩罚似然估计量、决策树和神经网络等机器学习工具的应用场景。由多种非参数估计量和大型参数模型组成，机器学习方法正是为了逼近未知的数据生成函数而生。此外，机器学习可以将许多数据源整合到一个模型中。由 1.2 节的讨论可知，为了更好地对价格或者预期收益率建模，我们需要丰富的条件信息集 $\mathcal{I}_t$ 。对于这一点，Cochrane (2005) 指出“我们显然无法观测到经济主体使用的所有信息，我们甚至很难在模型中包含所观测到的哪怕一小部分信息。”Hansen and Richard (1987)（以及最新的 Martin and Nagel 2022）强调了经济学模型中的投资者可接触到的信息量与模型外部的计量经济学家可获得的信息量之间的差距。机器学习提供了让研究者能够处理更大信息集的方法，从而帮助缩小研究者和市场参与者所使用的信息集大小的差距。

我们使用的条件信息集越丰富，模型就会越贴近现实。同样的逻辑适用于函数形式问题。市场参与者不仅将丰富的信息纳入预测，而且他们利用推理和直觉，使用非常复杂的方式来进行预测。我们必须认识到，作为研究者，我们无从知道投资者使用信息的具体方式，因此也就无法在参数统计模型中详尽地（当然更不可能简洁地）指定该方式。正如 Cochrane (2005) 提醒我们在考虑条件信息时要谨慎一样，我们在考虑函数形式时也必须同样谨慎。

1.4 机器学习 vs 计量经济学

到底什么是机器学习，它与传统的计量经济学有何不同？Gu, Kelly and Xiu (2020) 强调，机器学习的精确定义尚无定论，且其定义有时会因使用者的市场营销目的而扭曲。我们遵循 Gu, Kelly and Xiu (2020) 的定义，将机器学习描述为以下三方面的总和：（i）用于统计预测的多样化高维模型的集合，（ii）用于模型选择和降低过拟合的“正则化”方法，以及（iii）用于搜索大量潜在模型设定的高效算法。

根据这个定义，金融机器学习可被理解为一套用于估计统计模型并使用该模型进行决策的程序。因此，从本质上讲，我们无需将机器学习与计量经济学或统计学区分开来。机器学习背后的很多理念在过去几十年里已经在统计学的大旗下生根发芽（Israel, Kelly and Moskowitz 2020）。

为了通过数据来学习，机器需要一个关于其学习任务的函数化表达。研究者必须对此做出选择 —— 这将决定我们将会从数据中得到怎样的发现。前述关于机器学习定义的第（i）部分指出，机器学习对函数化表示几乎没有约束，它可以是高度参数化且通常是非线性的。另一方面，小模型往往不够灵活且过于简化，但其简洁性有利于精确的参数估计并很容易解释。大型和复杂的模型则要灵活得多，但也可能对样本内的噪声更加敏感，并因为对噪声的过拟合而削弱其在样本外的表现。当研究者认为更准确地描述现实世界的复杂现象所带来的好处超过过拟合的成本时，他们便会转而使用大模型。从直观上讲，当分析师不确定其统计模型应采取哪种具体结构化假设时，机器学习便提供了进行统计分析的另一种途径。从这个意义上讲，大部分的机器学习可以被视为非参数（或半参数）化建模。其运行范式考虑了各种可能的模型设定，并通过数据的指引来确定哪个模型对于手头待处理的问题最为有效。有人可能会问：分析师何时知道什么结构化假设适合他们的统计分析？答案当然是“永远不会”，而这就是为什么机器学习在金融研究中大有可为。正如 Breiman (2001) 所强调的，机器学习与传统统计学研究目标的最根本差异在于，前者在未知数据模型的前提下最大化预测准确性，而后者则在假设数据模型已知的前提下估计模型参数并进行统计检验。

定义的第（ii）部分强调，机器学习从“多样化的候选模型集合”中选择一个最佳模型（或模型组合）。同样的想法以模型选择（或与之相关的模型平均）的概念早已存在于计量经济学方法中。二者的不同之处在于，机器学习将模型选择置于实证设计的核心。寻找具有最优样本外预测性能模型的过程（通常被称为模型“调优”）是机器学习方法的重要特征。当然，从诸多模型中机械地选择会发生样本内过拟合，从而削弱样本外的表现。因此，机器学习的研究过程往往伴随着“正则化”，它是一个用于约束模型大小以确保样本外性能稳定性的通用术语。正如 Gu, Kelly and Xiu (2020) 所说，“最优模型是一个‘恰到好处的’模型。一方面，它足够大因而能够可靠地识别出数据中可能存在的复杂预测关系，而另一方面它又不至于过于灵活以至于由过拟合主导，从而影响样本外的表现。”正则化方法倾向于产生较小的模型；只有当更丰富的模型能够真正提升样本外预测准确性时，它们才能够脱颖而出。

机器学习定义中的第（iii）个组成部分也许是它与传统统计学最明显的不同之处，但也可能是经济学直觉最为最欠缺的部分。当数据集很大且/或模型参数太多时，计算量有可能成为瓶颈。机器学习已经发展出各种近似优化方法来减少计算负载。例如，传统的计量经济学估计量通常在迭代优化过程的每一步中使用所有数据点，并且只有在结果收敛时才停止参数搜索。而诸如使用数据子集以及在收敛前停止搜索等捷径通常能够以很小的准确性损失为代价而大大减少计算量（例如，随机梯度下降和早停法是训练神经网络时的两个基本要素）。

1.5 金融学中应用机器学习的挑战（及施加经济学约束的好处）

尽管金融研究在许多方面都非常适合机器学习方法，但金融领域的某些方面也对机器学习提出了挑战。理解这些障碍对于形成关于金融机器学习益处的正确预期至关重要。

首先，虽然机器学习通常被视为一个“大数据”工具，但许多金融学领域的基础问题都饱受经济时间序列中有限数据量的困扰。例如，在宏观金融中，标准数据集仅包含几百个月度观测值。如此程度的数据稀缺现实在其他机器学习领域是十分罕见的；在其他领域中研究者通常具有（出于各种意图和目的）无限的数据（或具备在需要时生成新数据的能力）。而在关于时间序列的研究中，新数据只有随着时间的推移而累积。

其次，金融研究经常面临低信噪比问题。这一点在收益率预测中最为明显，这是因为市场有效性的力量（利润最大化和竞争）始终在努力地消除价格走势中的任何可预测性（Samuelson 1965; Fama 1970）。因此，可以预见价格变化的主要来源是意料之外的新息（对于模型而言，这是无法预测的噪声）。市场也可能表现出无效性，投资者偏好也可能产生随时间变化的风险溢价，从而导致一定的收益率可预测性。尽管如此，我们仍应预期收益率的可预测性很低、但关于可预测性的竞争却非常激烈。

第三，市场会随时间不断演变而身处其中的投资者也会持续学习。因此机器学习预测模型的目标并非一成不变。先前得到的可靠的预测模式可能会因套利而被消除。监管和技术变化也可能会使经济结构发生变化。结构不满足平稳性使金融学对于机器学习而言成为一个特别复杂的领域，且不满足平稳性进一步加剧了有限数据量以及低信噪比带来的挑战。

这些挑战也提供了一个机会，让人们可以从经济理论知识中获益。如 Israel, Kelly and Moskowitz (2020) 指出：

统计分析的一个基本原则是，理论和模型参数可以相互替代。你在模型中施加的结构越多，你需要估计的参数就越少，且模型能够更有效地使用可用的数据来减少噪声。也就是说，由于能够过滤掉噪声，因此模型是有用的。但是，过于简化的模型也可能过滤掉一些信号，所以在数据充盈且信噪比高的环境中，人们往往不希望使用一个不必要的小模型。通过引入经济学理论来描述数据的某些属性，并配合机器学习算法来捕获理论无法描述的数据的另外一些属性，人们便可以开始解决数据量有限和信噪比很低这两个问题。

1.6 经济学内容（金融经济学的两种文化）

我们回顾一下 Breiman (2001) 关于统计学中 “两种文化”的论述，经过适当修改，它在金融经济学中也有一个类比。第一种是“结构模型/假设检验”文化，它倾向于施加完全或部分指定的结构化假设，并通过假设检验来研究经济机制。在简化形式的多因子模型和机器学习预测模型出现之前，传统的实证资产定价分析范式通过严格约束的预测模型来研究价格。其中约束形式包括（i）特定的函数形式以及扰动项分布，和（ii）被允许纳入到条件信息集的变量十分有限。这些模型的泛化能力很差，表现在它们无法解释超出模型假定的狭窄范围或超出训练数据集之外的资产价格行为。由于这一看法早已深入人心，人们几乎从不考虑这类完全指定的结构资产定价模型在样本外的表现。

另一种是“预测模型”文化，它最看重统计方面的解释力，且其发展主要得益于早先建立的结构模型无法有效解释实证数据。一旦能够产生更加有意义且稳健的数据拟合结果，哪怕模型设定和经济学理论之间缺乏明确的关联，这类模型也能够被预测模型文化所接纳。除了自 1990 年代以来主导实证金融研究的简化形式模型外，迄今为止的金融机器学习研究也完全符合这种文化。

在经济研讨会上，听众、讨论者和审稿人不时对统计预测研究抛出“欠缺经济学”的指责。这种批评常常是错误的，而我们应当防止它过度贬低金融机器学习的发展。我们不应忽视即使是最纯粹的统计建模应用在金融学中也扮演着重要的经济角色。和传统的进行结构假设检验的计量经济学相比，相对无结构的预测模型的经济重要性相当，这两者只是扮演了不同的科学角色。假设检验通过探究特定的机制来学习经济学。然而，检验理论机制并非经济学的全部。无理论的（我们想不到更好的术语）预测模型所触及的实证领域更加广泛，且能够描绘出全新的实证事实；基于这些事实，人们能够提出新理论并且通过假设检验来研究其背后的机制。这两种形式的实证研究 —— 精确的检验和粗略的探索 —— 在科学进步的库恩过程中发挥着互补的作用。

再回到资产定价研究的核心问题：资产的风险溢价到底由什么决定？即使能准确地观测到预期收益率，我们仍然需要理论来解释它们的行为，以及需要通过实证研究来检验这些理论。然而，我们并不能观测到风险溢价，此外准确地估计它们也难如登天。机器学习在衡量风险溢价方面取得了一定的进展，有助于人们提出更好的理论来解释决定收益率行为的经济机制。

拓展已有实证研究疆域的一个重要好处是，哪怕人们尚不能参透隐藏在新实证发现背后的经济机制，经济参与者 —— 尤其是金融市场参与者 —— 也总能从更多的实证发现中受益。一直以来，预测模型文化的传统是以帮助投资者、消费者以及政策制定者做出更好决策为目的而展开研究。改进的预测能够为经纪参与者提供关于状态依赖分布的更准确描述。

总的来说，经济学是一个应用领域。而预测模型文化的经济学恰恰体现在其能够提高预测能力。一旦具备更好的预测 —— 即对经济机会集的更准确的评估 —— 经济主体便能够在分配稀缺资源时更好地权衡成本和收益。这提高了社会的福利水平。在投资组合优化问题中，这一点显得尤为突出。我们也许不能总是理解模型通过什么经济机制提供了更好的收益率或风险预测；但如果它做到了，它就会提高投资者的效用，因此它在经济上是重要的。

Breiman 对结构假设检验文化的主要批评是：

当通过数据拟合来确定模型、并通过模型做出定量结论时：这些结论是关于模型的机制，而不是关于真实世界的机制。一旦模型不能很好地反映真实世界，那么通过模型得出的结论便可能是错误的。

我们并不将上述观点视为对结构建模的批判 —— 毕竟结构建模仍然是实证金融研究的基础 —— 而是将它视为对使用预测模型的辩护。当然，将两种文化完全对立开来同样是不可理喻的。学术研究往往二者兼顾且需要利用诸多工具，研究者们也并非被划分到不同的意识形态阵营（每个阵营是同质的）。两种文化在经济上都很重要。Breiman 鼓励人们考虑灵活的乃至是非参数化模型，以更好的了解经济机制：

模型的目的是获取关于因变量和自变量之间关系的有用信息。可解释性是获取信息的一种方式。但是，并非只有简单的模型才能提供关于二者之间关系的准确信息；同样也并非只有（结构）数据模型才能实现上述目标。

预测模型是理解机制的第一步。此外，结构建模也可以直接从机器学习中受益，而这种受益并不以牺牲有针对性的假设检验或其特定的经济机制为前提。到目前为止，机器学习更多地出现在金融经济学的预测模型文化中。然而很重要的一点是要认识到，对于结构假设检验文化而言，它同样是一个强大的工具（这是未来金融机器学习研究的一个重要方向）。当然，对于一个仅仅建立于“无理论测量”（Koopmans 1947）之上的研究方式来说，如果我们同时通过经济学理论以及深入理解 Lucas (1976) 批判来思考数据，将会使它发挥更大的作用。同样，一个仅通过现有经济模型解释数据的研究方式也很可能会忽视掉意想不到、但经济上非常重要的统计模式。

Hayek (1945) 研究了分散化信息对资源配置的经济影响。关于如何实现有效的经济秩序的核心问题，他指出：

如果我们掌握了所有相关信息，如果我们可以从给定的偏好系统出发，如果我们掌握了可用手段的完整知识，那么剩下的问题就纯粹是逻辑问题……然而，这显然不是社会面临的经济问题。人们提出的经济计算虽然是解决社会经济问题的重要步骤，但尚未就该问题给出答案。这其中的原因是，经济计算的起始数据是从整个社会收集的所有相关数据，没有哪个人或者单个机构能完全获得并理解所有的数据以及数据变化所带来的经济影响（译者注：在经济领域，这个观点被广泛接受。这也是为什么我们需要使用统计模型，以便从大量多样的数据中抽取有用的信息，并尝试预测和理解经济现象）。

虽然 Hayek 主要关注的是分散式计划的优点，但他的陈述也适用于一般的信息技术，特别是预测技术。让我们大胆地从统计学问题视角重新解读 Hayek 的观点：经济主体在数据生成过程（DGP）已知时所能够实现的配置效率，与其在必须估计 DGP 时所能够实现的配置效率二者之间存在差距。其中的第一个原因是模型设定偏误问题，即我们不能指望经济主体正确地设定统计模型。他们只能使用某种带设定偏误的参数模型或非参数近似模型。在任何一种情况下，模型设定偏误都会导致已知 DGP 时的最优配置（称之为“第一最优解”）与由该模型得到的最优配置（称之为“第二最优解”）之间存在差距。然而，由于我们必须通过有限的数据来估计模型，因此即便是第二最优解也只是水中望月。这就引发了由采样波动导致的另一个差距。即使我们知道 DGP 的函数形式，我们仍然需要估计它，而估计中的噪声会导致最终偏离第一最优解。再叠加模型设定偏误问题，我们实际上只能获得“第三最优解”的配置，即来自一个误设模型的噪声估计所产生的解。

如果我们能够通过使用善于处理大量信息和数据集的方法而获得改进的预测，便可使缩小前文中提到的差距（即 Hayek 提到的第一最优资源配置这一纯粹的“逻辑问题”和经济主体能够实现的第三最优现实配置这二者的差距）成为可能。由于可学习性的统计限制（Da, Nagel and Xiu 2022；Didisheim, et al. 2023），我们永远无法完全消除上述差距。但是，强大的近似模型和巧妙的正则化方法意味着机器学习在经济上是重要的，而其重要性恰恰源自它能够产生更好的决策。投资组合选择问题能够很好地说明这一点。如果一个遵循现代投资组合理论的投资者知道真实的预期收益率和协方差矩阵，那么他只需将它们套入到 Markowitz 理论的“逻辑”之中便能够得到第一最优解。然而，与 Hayek 的问题类似，这并非现实世界中的投资者所要处理的问题。相反，他们的问题主要是一个估计问题（一类预测问题）。投资者的目标是获得关于预期收益率和协方差矩阵的合理估计，以便当他们采用 Markowitz 理论时，能够获得稳健的样本外表现。一旦这个前提不成立，即缺少高质量的估计值，Markowitz 的最优解将会导致灾难性的配置后果。这一点已在很多研究中得到证实。

参考文献

Breiman, L. (2001). Random forests. Machine Learning 45(1), 5 – 32.

Chen, H., W. W. Dou, and L. Kogan (forthcoming). Measuring “Dark Matter” in Asset Pricing Models. Journal of Finance.

Cochrane, J. H. (2005). Asset Pricing: Revised Edition. Princeton University Press.

Da, R., S. Nagel, and D. Xiu (2022). The statistical limit of arbitrage. Working paper.

Didisheim, A., S. Ke, B. T. Kelly, and S. Malamud (2023). Complexity in factor pricing models. Working paper.

Fama, E. F. (1970). Efficient capital markets: A review of theory and empirical work. Journal of Finance 25(2), 383 – 417.

Gu, S., B. T. Kelly, and D. Xiu (2020). Empirical asset pricing via machine learning. Review of Financial Studies 33(5), 2223 – 2273.

Hansen, L. P. and S. F. Richard (1987). The role of conditioning information in deducing testable restrictions implied by dynamic asset pricing models. Econometrica 55(3), 587 – 613.

Hansen, L. P. and K. J. Singleton (1982). Generalized instrumental variables estimation of nonlinear rational expectations models. Econometrica 50(5), 1269 – 1286.

Hayek, F. A. (1945). The use of knowledge in society. American Economic Review 35(4), 519 – 530.

Israel, R., B. Kelly, and T. J. Moskowitz (2020). Can Machines “Learn” Finance? Journal of Investment Management 18(2), 23 – 36.

Koopmans, T. C. (1947). Measurement without theory. Review of Economics and Statistics 29(3), 161 – 172.

Lucas Jr, R. E. (1976). Econometric policy evaluation: A critique. In: Carnegie-Rochester Conference Series on Public Policy. Vol. 1. North-Holland. 19 – 46.

Martin, I. W. and S. Nagel (2022). Market efficiency in the age of big data. Journal of Financial Economics 145(1), 154 – 177.

Mehra, R. and E. C. Prescott (1985). The equity premium: A puzzle. Journal of Monetary Economics 15(2), 145 – 161.

Samuelson, P. A. (1965). Rational theory of warrant pricing. Industrial Management Review 6(2), 13 – 39.

免责声明：入市有风险，投资需谨慎。在任何情况下，本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下，本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外，文中图表均直接或间接来自于相应论文，仅为介绍之用，版权归原作者和期刊所有。

中国·金沙集团1862成色(澳门)入口平台|think tank百科

合格投资者声明

Financial Machine Learning