等权重投资组合的选择置信集
摘要
在由N个资产构成的投资域中,投资者普遍采用构建等权重投资组合(EWP)的子集选择策略。该策略虽然简单稳健,且在样本外表现优异,但在很大程度上忽略了关于哪个子集表现真正最佳的“选择不确定性”问题。传统方法通常依赖于单一选定的投资组合,但这未能考虑到在统计不确定性下可能表现同样出色的其他投资策略。为了解决这一选择不确定性问题,我们引入了等权重投资组合的“选择置信集”(SCS)这一概念。我们将其定义为:在给定的损失函数和置信水平下,能够包含未知最优投资组合集合的所有组合构成的集合。SCS通过其规模来量化选择不确定性,其功能类似于传统的置信区间:当数据噪声较大或数据量有限时,其规模会扩大;而随着样本量的增加,其规模则会缩小。理论上,我们证明了SCS能够以高概率覆盖未知的最优选择,并通过蒙特卡洛实验验证了其理论性质。本文将该方法应用于法国17个行业投资组合和Layer-1加密货币数据集的实证分析,这些应用凸显了在比较等权重策略时考虑选择不确定性的重要性。
关键词: 等权重投资组合, 选择置信集, 选择不确定性, 子集选择, 沃尔德检验
--------------------------------------------------------------------------------
1. 引言
本节旨在从现代投资组合理论的基石——马科维茨的均值-方差理论出发,剖析其中长期存在的资产选择不确定性问题。我们将探讨为何等权重投资组合(EWP)作为一种稳健的替代方案而兴起,并最终引出本文的核心议题:解决EWP子集选择中的不确定性。为此,我们提出了“选择置信集”(SCS)框架,以系统性地量化并应对这一挑战。
投资组合理论的基石与挑战
由马科维茨(Markowitz, 1952)提出的均值-方差理论是现代投资组合理论的基石,它为识别在给定风险水平下能最大化预期收益的投资组合提供了严谨的数学框架。尽管后续的投资组合选择理论取得了长足进步(例如,Sharpe, 1964; Ross, 1976; Fama and French, 1992),但资产选择过程中的不确定性始终是一个核心挑战。在预期收益或协方差的估计中,即使是微小的误差也可能导致所选资产配置发生巨大变化,使得任何单一投资组合都难以被认定为绝对最优。这种敏感性可能导致高换手率(Chopra and Ziemba, 2013),并且在考虑交易成本后,使得理论上的最优配置在实践中变得不可行(DeMiguel et al., 2009)。
等权重投资组合(1/N)的兴起
越来越多的研究表明,简单的分配规则在实践中往往优于复杂的优化策略。特别是等权重投资组合(EWP),又称“1/N规则”,因其简单性、强大的样本外表现、对估计误差的稳健性以及内置的多样化效果,已成为一个稳健的基准(DeMiguel et al., 2009; Plyakha et al., 2015)。EWP通过避免对收益矩的估计,规避了优化过程中的不稳定性,并能在再平衡过程中利用均值回归效应。
EWP子集选择的前沿与局限
受EWP优势的启发,近期研究开始探索使用数据驱动方法来选择最优的EWP子集。例如,Lee (2020) 提出了一种深度学习算法来识别表现最佳的资产,而Caparrini等人 (2024) 则应用树状分类器来选择标普500成分股的等权重子集。然而,这些方法的有效性常常受到金融市场噪声的限制。更重要的是,市场上存在大量表现相似的投资组合,这使得识别出单一的、占主导地位的EWP变得极为困难。
本文的核心贡献:引入选择置信集(SCS)
为了系统性地刻画EWP选择中的不确定性,本文采取了一种多组合视角,而非专注于识别单一最优组合。我们正式提出了本文的核心贡献——选择置信集(Selection Confidence Set, SCS)。SCS被定义为在特定的置信水平(例如95%)下,所有其表现在统计上与未知最优EWP无法区分的资产选择所构成的集合。SCS提供了一种原则性的方法来量化和应对选择不确定性。
作为一个直观的例证,图1展示了基于法国17个行业投资组合数据计算出的各EWP的样本均值和标准差。在5%的显著性水平下,我们发现有408个投资组合(图中的绿色实心点)的均值-方差损失在统计上与经验最优组合(红色三角)无法区分。这些组合共同构成了SCS。SCS的庞大规模和多样性凸显了选择不确定性的普遍存在,以及过度解读任何单一最优估计所带来的风险。
图1: 法国17行业投资组合数据中各EWP的样本均值和标准差。红色三角标记了最小化损失函数 L(µ, σ²) = σ² − 0.5µ 的经验最优组合。绿色实心点代表基于第2节中沃尔德型检验构建的95% SCS内的组合;灰色空心点表示SCS外的组合。
与相关研究的比较
本文提出的SCS框架与统计学和金融学中的相关概念,特别是Hansen等人(2011)的“模型置信集”(Model Confidence Set, MCS),共享多模型分析的理念。然而,二者在核心目标上存在根本区别。MCS旨在筛选出一个集合,其中包含所有不显著差于样本内最佳表现模型的模型。相比之下,SCS具有推断性质,其目标是在指定的置信水平下覆盖总体(population)中的最优模型。
论文结构概述
本文的其余部分组织如下:第二节介绍SCS的构建框架;第三节为其提供理论保证;第四节引入一系列选择后度量指标,用于解释SCS的结构;第五节报告蒙特卡洛模拟的结果;第六节将该方法应用于实证数据分析;第七节总结全文。
--------------------------------------------------------------------------------
2. 方法论:为最优等权重投资组合构建置信集
本节将详细阐述构建选择置信集(SCS)的技术细节。我们将从基本设定和目标出发,重点介绍基于沃尔德型检验的筛选机制。这是将选择不确定性从一个理论概念,转化为一个可操作、可量化的分析工具的核心步骤。
2.1 框架与目标
设 X = (X₁, ..., XN)ᵀ 为一个N维资产收益的随机向量。一个等权重投资组合 Ys 被定义为: Y_s = \frac{\sum_{i=1}^{N} s_i X_i}{\sum_{j=1}^{N} s_j} \quad, \quad s = (s_1, \dots, s_N) \in \mathcal{S} := {0, 1}^N \setminus {\mathbf{0}} \quad (1) 其中 s 是一个二元向量,sᵢ=1 表示资产 i 被选中,sᵢ=0 则表示未被选中。S 代表所有可行的选择集合。
我们定义一个损失函数 L(µ, σ²),它根据投资组合的均值 µ 和方差 σ² 来评估其性能。例如,在均值-方差准则下,损失函数可以设为 L(µs, σ²s) = σ²s - γµs,其中 γ > 0。基于此,最优资产选择集 S₀ 定义为: \mathcal{S}0 := \arg\min{s \in \mathcal{S}} L(\mu_s, \sigma_s^2) \quad (2) 由于 S 是有限的,S₀ 至少包含一个最优选择。我们的核心目标是,在给定一个置信水平 1-α(如95%)下,构建一个选择置信集 Ŝα,使其满足: P(\mathcal{S}0 \subseteq \hat{\mathcal{S}}\alpha) \geq 1-\alpha \quad (3) 该条件确保在重复抽样中,Ŝα 以至少 1-α 的概率覆盖真实的最优选择集 S₀。
SCS在投资组合选择中具有两大核心功能:
* 功能一:合理性评估。 SCS能够用于评估一个给定的候选投资组合 s 是否得到了实证数据的支持。通过检验 s 是否属于 Ŝα(即 s ∈ Ŝα),决策者可以对其选择进行严格的统计验证。
* 功能二:量化不确定性。 SCS的大小和构成直观地量化了选择的不确定性程度。例如,一个仅包含单个元素的SCS表明数据指向一个唯一的、明确的最优解;而一个庞大的SCS则表明数据信息有限,存在大量统计上难以区分的备选方案,选择不确定性很高。
2.2 基于沃尔德检验筛选的构建方法
构建SCS的核心是一种排除法,通过对每个候选组合 s 进行一系列假设检验来完成。我们的目标是筛选出所有在统计上与未知最优组合无法区分的策略。为此,我们为每个 s 设立原假设 H₀:该组合与最优组合的性能差异为零 [见公式(4)]。如果检验结果无法拒绝 H₀,则意味着没有足够的统计证据将 s 排除,因此它将被保留在SCS中。原假设 H₀ 定义为: H_0: \delta(s) = L(\mu_s, \sigma_s^2) - L(\mu_{s_0}, \sigma_{s_0}^2) = 0 \quad (4) 由于真实的最优集 S₀ 是未知的,我们使用其经验替代,即在样本上最小化损失函数得到的经验最优选择 ŝ₀: \hat{s}0 := \arg\min{s \in \mathcal{S}} L(\hat{\mu}_s, \hat{\sigma}_s^2) \quad (6) 其中 µ̂s 和 σ̂²s 是组合 s 的样本均值和样本方差。在温和的正则性条件下,ŝ₀ 会依概率收敛到真实最优集 S₀ 中的某个元素,这为使用 ŝ₀ 作为基准提供了理论依据。
最终,SCS的构建公式如下: \hat{\mathcal{S}}_\alpha := \left{ s \in \mathcal{S} : Z(s; \hat{s}0) \leq q{1-\alpha} \right} \quad (7) 其中 q₁₋α 是标准正态分布的 1-α 分位数,Z(s; ŝ₀) 是学生化的性能差异统计量: Z(s; s') := \frac{\hat{\delta}(s; s')}{\sqrt{\hat{\tau}(s; s')^2 / T}} = \frac{L(\hat{\mu}s, \hat{\sigma}{s'}, \hat{\sigma}{s'}^2)}{\sqrt{\nabla\hat{\delta}(s; s')^\top \hat{V}(s; s') \nabla\hat{\delta}(s; s') / T}} \quad (8)^1 这里,δ̂(s; s′) 是经验性能差异,τ̂(s; s′)² 是其估计方差,T 是样本量,∇δ̂(s; s′) 是损失差异函数关于矩估计量 (µ̂s, σ̂²s, µ̂s′, σ̂²s′) 的梯度,而 V̂(s; s′) 是这些矩估计量联合渐近协方差矩阵的一致估计。
该方法的理论基础是中心极限定理。在温和的正则性条件下,经验矩估计量是联合渐近正态分布的: \sqrt{T} \left( \hat{\theta}(s; s') - \theta(s; s') \right) \xrightarrow{d} N_4(\mathbf{0}, V(s; s')) \quad (10) 这保证了检验统计量 Z(s; ŝ₀) 在原假设 H₀ 下渐近服从标准正态分布。
2.3 独立同分布(i.i.d.)抽样下的筛选
在资产收益服从独立同分布(i.i.d.)正态分布的理想化条件下,该框架可以得到简化。例如,对于夏普比率损失 L(µ, σ²) = -µ/σ,SCS的具体形式为: \hat{\mathcal{S}}_\alpha = \left{ s \in \mathcal{S} : \frac{\sqrt{T} (\hat{r}s - \hat{r}{\hat{s}0})}{\sqrt{2(1 - \hat{\rho}{s\hat{s}_0}) + \frac{1}{2}(\hat{r}s^2 + \hat{r}{\hat{s}0}^2) - \hat{\rho}{s\hat{s}_0}^2 \hat{r}s \hat{r}{\hat{s}0}}} \leq q{1-\alpha} \right} \quad (12) 其中 r̂s 是组合 s 的样本夏普比率,ρ̂sŝ₀ 是组合 s 和 ŝ₀ 之间的样本相关系数。
在建立了SCS的构建方法后,下一节将从理论上证明其有效性并分析其性质。
--------------------------------------------------------------------------------
¹注意,τ̂(s; s′)² 代表性能差异的估计方差。我们将标准误的公式表述为 sqrt(τ̂(s; s′)² / T),这与源文本中的展开定义和标准统计实践保持一致。
3. 理论性质:渐近有效性与规模
在上一节构建了SCS之后,本节将为其提供坚实的理论基础。我们将通过两个核心命题来证明其统计上的可靠性:一是确保SCS能够以预设的概率覆盖真实的最优解,二是从理论上刻画影响SCS规模的关键因素。
3.1 渐近覆盖率
为了确保SCS的理论性质成立,我们需要以下两个高阶假设:
* (A1) 矩估计量 (µ̂s, σ̂²s, µ̂s′, σ̂²s′) 联合满足中心极限定理,如公式(10)所示。
* (A2) 其协方差矩阵 V̂(s, s′) 的估计是一致的。
这两个假设在相当普遍的条件下成立,例如,对于i.i.d.数据,只需四阶矩存在即可。
命题 1 (最优集的渐近覆盖率): 在假设 (A1)-(A2) 下,由公式 (7) 定义的选择置信集 Ŝα 满足渐近覆盖性质: \lim_{T \to \infty} P(\mathcal{S}0 \subseteq \hat{\mathcal{S}}\alpha) \geq 1-\alpha
结果解读: 命题1的有效性依赖于两个关键要素。首先,样本矩的收敛性确保了经验最优选择 ŝ₀ 能够收敛至真实最优集 S₀ 中的某个元素。其次,检验统计量的分布收敛性确保了我们的检验具有正确的渐近水平 α。值得强调的是,当不同组合间的损失差异很小,或方差估计的噪声很大时,SCS的规模可能会变得很大。这并非方法的缺陷,而是对数据中高度不确定性的真实反映,是保证覆盖率所必需的统计代价。
3.2 渐近期望规模
为了分析SCS的规模,我们引入一个关键度量——标准化损失差异 γ(s): \gamma(s) := \frac{\delta(s)}{\tau(s)} = \frac{L(\mu_s, \sigma_s^2) - L(\mu_0, \sigma_0^2)}{\sqrt{\nabla\delta(s, s_0)^\top V(s, s_0) \nabla\delta(s, s_0)}} \quad (13) γ(s) 衡量了次优组合 s 与最优组合之间性能差异的“信噪比”。这个指标决定了一个次优组合被错误地纳入SCS的概率。
命题 2 (SCS的渐近期望规模): 在假设 (A1)-(A2) 下,SCS的期望规模满足: E[|\hat{\mathcal{S}}_\alpha|] = |\mathcal{S}0|(1-\alpha) + \sum{s \in \mathcal{S} \setminus \mathcal{S}0} \Phi\left( q{1-\alpha} - \sqrt{T}\gamma(s) \right) + o(1) \quad (14) 其中 Φ(·) 是标准正态分布的累积分布函数。
结果解读: 命题2清晰地揭示了SCS规模的决定因素。当一个次优组合的标准化损失差异 γ(s) 较大时,√Tγ(s) 会很大,导致其被纳入的概率 Φ(q₁₋α - √Tγ(s)) 会指数级地衰减至零,该组合最终将被排除。因此,SCS的最终规模主要由那些 γ(s) 极小,即在统计上与最优组合难以区分的次优组合的数量所决定。
基于此,我们可以推导出SCS期望规模的近似上下界: \mathcal{S}0|(1-\alpha) + o(1) \leq E[|\hat{\mathcal{S}}\alpha|] \leq |\mathcal{S}0|(1-\alpha) + (2^N - |\mathcal{S}{1-\alpha} - \sqrt{T}\gamma{\text{min}} \right) + o(1) \quad (15) 其中 γ_min 是所有次优组合中最小的标准化损失差异。当所有次优模型都与最优模型良好分离时(即 γ_min 较大),SCS的期望规模将集中在 |S₀|(1-α) 附近。
在建立了SCS的理论基础后,下一节将介绍一系列实用的度量指标,以便从SCS中提取有意义的洞见。
--------------------------------------------------------------------------------
4. 实证工具:选择后度量指标
理论分析确认了SCS的有效性,但SCS本身只是一个组合的集合。本节旨在提供一套描述性统计工具,用于剖析SCS的结构,从而将这个抽象的集合转化为关于选择不确定性、关键资产和投资策略的直观洞见。
全局选择不确定性度量
* 基本度量: SCS的基数 |Ŝα| 和相对基数 |Ŝα|/|S| 是衡量不确定性的最直接指标,其中 |S| 是所有可行组合的总数。
* 相对多样性指数 (Relative Multiplicity Index, RMI): \text{RMI} := 1 - \frac{\log(|\hat{\mathcal{S}}_\alpha|)}{\log(|\mathcal{S}|)} \quad (16) RMI的取值范围从0(最大不确定性,|Ŝα| 接近 |S|)到1(唯一选择,|Ŝα| = 1)。对数变换使其能更好地处理组合数量随资产数量指数级增长的情况。
* 性能范围: 观测到的损失区间 (L̂₀, L̂max) 和相关的性能跨度 δ̂α = L̂max - L̂₀ 量化了SCS内组合的性能差异。这些指标在风险敏感型应用中尤其重要,例如,管理者可能只接受那些性能跨度低于某个可容忍阈值的候选组合。
下边界(LB)投资组合
我们定义下边界(Lower-Boundary, LB)投资组合 Ŝα 为SCS中最精简的组合集合。形式上,Ŝα 包含了SCS中所有不以任何其他SCS内组合为真子集的组合。这些组合揭示了实现可接受的风险回报所需的核心资产,为构建精简且稳健的投资策略提供了数据驱动的基础,这在考虑交易成本或追求可解释性时尤为宝贵。
资产层面的重要性度量
* 纳入重要性 (Inclusion Importance, IIα): 资产 j 的纳入重要性定义为它在SCS中出现的频率: \text{II}\alpha(j) := \frac{1}{|\hat{\mathcal{S}}\alpha|} \sum_{s \in \hat{\mathcal{S}}_\alpha} s_j IIα(j) 接近1表示资产 j 在几乎所有表现优异的组合中都存在,表明其具有系统重要性。
* 共同纳入重要性 (Co-inclusion Importance, CIIα): 资产对 (i, j) 的共同纳入重要性衡量了它们在SCS中同时出现的频率,相对于它们各自的边际出现频率。高 CIIα 值表示资产 i 和 j 之间存在很强的互补性,而低值则可能反映了它们之间的排他性或替代关系。通过构建以资产为节点、以 CIIα 为边权重的资产图,我们可以直观地揭示资产间的聚类结构和多样化模式。
在定义了这些解释性工具后,接下来的部分将通过模拟实验来检验SCS在受控环境下的实际表现。
--------------------------------------------------------------------------------
5. 数值实验:模拟研究
理论分析为SCS提供了渐近保证,而本节将通过受控的蒙特卡洛模拟实验,在有限样本条件下检验SCS的实际性能。我们将重点评估其覆盖概率和规模如何受样本量、资产数量和市场结构等关键因素的影响。
5.1 模拟设置
我们假设资产收益 X 来自一个均值为 η、协方差为 Σ 的多元正态分布。为了模拟不同的市场条件,我们使用以下两种模型来构建相关矩阵 R:
* 模型1(图结构): 我们基于一个无标度图结构生成逆协方差矩阵,以反映经验上观察到的资产间复杂的条件依赖性。参数 v > 0 控制条件依赖的强度,v 越大,依赖性越强。
* 模型2(可交换结构): 我们设置一个统一的相关系数 ρ,以代表市场中普遍存在的温和或强烈的联动性。
在每次模拟中,我们计算三个核心指标:SCS的期望基数 κα,其下边界的期望基数 κα,以及覆盖概率 pα。
5.2 模拟结果分析
表1和表2分别展示了在强依赖(模型1, v=1)和强相关(模型2, ρ=0.75)结构下,N=10 时的模拟结果。
表1:模型1(图结构, v=1)下的SCS性能 | L(µ, σ²) | T | κα (90%) | pα% (90%) | κα (90%) | κα (95%) | pα% (95%) | κα (95%) | κα (99%) | pα% (99%) | κα (99%) | | :--- | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | -µ/σ | 100 | 125.7 (7.0) | 71.3 (2.6) | 3.4 (0.1) | 294.5 (13.0) | 84.7 (2.1) | 5.1 (0.1) | 630.9 (14.8) | 97.3 (1.0) | 7.6 (0.1) | | | 250 | 67.5 (4.7) | 82.3 (2.2) | 2.8 (0.1) | 143.2 (6.8) | 91.7 (1.6) | 4.1 (0.1) | 418.8 (13.2) | 99.3 (0.6) | 6.4 (0.1) | | | 1000 | 13.1 (0.7) | 89.0 (1.8) | 1.6 (0.1) | 25.4 (1.4) | 98.0 (0.8) | 2.2 (0.1) | 81.2 (3.8) | 99.3 (0.6) | 3.6 (0.1) | | -0.5µ+σ² | 100 | 290.4 (19.5) | 71.0 (2.6) | 4.4 (0.1) | 523.6 (21.5) | 87.7 (2.0) | 5.9 (0.1) | 864.5 (16.5) | 96.3 (1.2) | 8.3 (0.1) | | | 250 | 167.6 (12.3) | 84.3 (2.3) | 3.6 (0.1) | 364.0 (19.1) | 91.0 (1.5) | 4.7 (0.1) | 727.9 (18.8) | 100.0 (0.0) | 6.9 (0.1) | | | 1000 | 19.7 (1.6) | 92.3 (1.4) | 2.2 (0.1) | 56.0 (5.3) | 96.3 (0.8) | 2.7 (0.1) | 205.5 (13.4) | 100.0 (0.0) | 3.9 (0.1) |
表2:模型2(可交换结构, ρ=0.75)下的SCS性能 | L(µ, σ²) | T | κα (90%) | pα% (90%) | κα (90%) | κα (95%) | pα% (95%) | κα (95%) | κα (99%) | pα% (99%) | κα (99%) | | :--- | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | -µ/σ | 100 | 74.9 (7.2) | 90.7 (1.7) | 3.6 (0.1) | 196.4 (14.2) | 95.7 (1.2) | 4.8 (0.1) | 557.3 (20.5) | 98.7 (0.7) | 6.9 (0.1) | | | 250 | 17.8 (2.3) | 95.3 (1.2) | 2.6 (0.1) | 60.4 (5.8) | 98.0 (0.8) | 3.6 (0.1) | 223.3 (13.2) | 99.3 (0.5) | 5.3 (0.1) | | | 1000 | 3.3 (0.1) | 97.0 (1.0) | 1.8 (0.0) | 4.7 (0.2) | 99.7 (0.3) | 2.1 (0.0) | 10.8 (0.8) | 100.0 (0.0) | 2.5 (0.0) | | -0.5µ+σ² | 100 | 116.4 (11.1) | 90.7 (1.7) | 4.0 (0.1) | 306.6 (18.8) | 96.0 (1.1) | 5.5 (0.1) | 645.2 (20.7) | 99.7 (0.3) | 7.8 (0.1) | | | 250 | 32.4 (3.5) | 94.0 (1.4) | 2.9 (0.1) | 73.6 (7.5) | 98.3 (0.7) | 3.5 (0.1) | 321.9 (17.2) | 99.7 (0.3) | 5.7 (0.1) | | | 1000 | 3.4 (0.1) | 97.3 (0.9) | 1.8 (0.0) | 5.8 (0.4) | 99.3 (0.5) | 2.0 (0.0) | 14.5 (1.2) | 100.0 (0.0) | 2.5 (0.0) |
基于这些数据,我们总结出以下关键发现:
* 样本量(T)的影响: 正如理论所预测,随着样本量 T 的增加,数据的信息含量提升,从而降低了选择不确定性,这直接体现在SCS规模(κα)的迅速缩小上。同时,覆盖率 pα 随 T 增加而接近或超过名义水平(如90%, 95%),验证了方法的渐近有效性。
* 置信水平(1-α)的影响: 更高的置信水平(如从90%到99%)会导致更具包容性的筛选,从而产生规模更大的SCS和更高的覆盖率,这完全符合置信集的基本构建原理。
* 下边界(LB)集的规模: 下边界集 Ŝα 的规模(κα)远小于整个SCS,其构成通常是仅包含少数资产的稀疏组合。这表明,尽管存在大量统计上等效的复杂组合,但实现接近最优性能的核心资产组合是相对有限和精简的。
* 资产依赖结构与损失函数的影响: 不同的资产依赖强度(由 v 和 ρ 控制)和不同的损失函数(如均值-方差 vs. 预期短缺)会影响SCS的规模。例如,更强的依赖性会放大组合间的性能差异,从而提高检验的功效,使得SCS规模变小。
* 资产数量(N)的影响: 图2直观地展示了资产数量 N 如何成为选择不确定性的主要驱动因素。随着 N 的增长,可行EWP的总数(2ᴺ-1)呈指数级增长,导致SCS的期望规模 κα 急剧扩大。这并非方法的缺陷,而是真实地反映了在更大的投资域中所固有的、更高的选择不确定性。
图2: 在95%置信水平下,SCS期望规模 κα 随资产数量N的变化。左列为模型1,右列为模型2。不同行对应不同损失函数。
5.3 与Ledoit-Wolf(LW)夏普比率检验的比较
我们还比较了基于Ledoit和Wolf(2008)提出的自举(bootstrap)检验构建的SCS与基于渐近正态性假设的SCS。如表3所示,LW方法在小样本(如 T=100)中能实现更接近名义水平的覆盖率,因为它能更好地控制第一类错误。然而,这种方法的代价是通常更为保守,导致SCS规模更大,检验功效可能更低。这反映了在有限样本精度和推断选择性之间存在的权衡。
表3:基于LW检验的SCS性能(模型1, 夏普比率损失) | v | T | κα (90%) | pα% (90%) | κα (90%) | κα (95%) | pα% (95%) | κα (95%) | κα (99%) | pα% (99%) | κα (99%) | | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | 1 | 100 | 310.7 (13.4) | 91.0 (1.7) | 5.2 (0.1) | 447.4 (15.2) | 94.7 (1.3) | 6.3 (0.1) | 747.4 (14.0) | 100.0 (0.0) | 8.2 (0.1) | | | 1000 | 25.7 (1.5) | 95.7 (1.2) | 2.2 (0.1) | 42.5 (2.0) | 98.7 (0.7) | 2.8 (0.1) | 118.6 (5.0) | 99.7 (0.3) | 4.3 (0.1) | | 0.2 | 100 | 294.5 (13.1) | 84.0 (2.1) | 5.3 (0.1) | 441.3 (14.5) | 91.0 (1.7) | 6.4 (0.1) | 755.7 (13.3) | 100.0 (0.0) | 8.4 (0.1) | | | 1000 | 31.9 (1.7) | 96.3 (1.1) | 2.5 (0.1) | 51.8 (2.6) | 98.7 (0.7) | 3.0 (0.1) | 126.1 (5.1) | 99.7 (0.3) | 4.5 (0.1) |
模拟研究的结果有力地验证了SCS的理论属性,并为其在下一节的真实数据应用奠定了坚实的基础。
--------------------------------------------------------------------------------
6. 实证应用:加密货币与行业投资组合分析
本节旨在展示SCS方法在真实金融市场中的应用价值。我们将通过分析两个截然不同的市场环境——高波动性的Layer-1加密货币市场和成熟的美国股票行业市场——来展示SCS如何揭示并量化在实践中普遍存在但常被忽视的选择不确定性。
6.1 数据集与设置
* L1-Crypto数据集: 包含16种Layer-1加密货币的日对数回报率,时间跨度为2022年1月1日至2025年1月1日(T=1095)。该市场以高波动性和投机性为特征。
* 法国17行业数据集: 包含17个美国行业的等权重投资组合日回报率,时间跨度为2021年11月1日至2024年10月31日(T=755)。该数据集代表了成熟的股票市场。
我们分别为两个数据集选择了合适的损失函数:为加密货币市场选择夏普比率损失,为行业组合选择均值-方差损失。通过穷举搜索,我们得到的经验最优组合分别为:L1-Crypto数据下,夏普比率损失的最优组合为{TRON, Mantra},均值-方差损失的最优组合为{Bitcoin, TRON};17行业数据下,两种损失函数下的最优组合均为{Steel, Utilities}。
6.2 全局不确定性分析
表4报告了两个数据集的后选择度量指标。
表4:实证数据的后选择度量指标 | 数据集 | L(µ, σ) | (1-α)% | |Ŝα| | |Ŝα| | RMI(%) | L̂₀(%) | L̂max(%) | δ̂α(%) | | :--- | :--- | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | L1-Crypto | -µ/σ | 90 | 20 | 3 | 72.99 | -5.09 | 1.68 | 6.77 | | | | 95 | 122 | 9 | 56.68 | -5.09 | 3.37 | 8.46 | | | | 99 | 8,128 | 12 | 18.82 | -5.09 | 3.37 | 8.46 | | | -µ+0.5σ² | 90 | 85 | 4 | 59.94 | 0.03 | 0.17 | 0.14 | | | | 95 | 288 | 5 | 48.94 | 0.03 | 0.24 | 0.21 | | | | 99 | 3,068 | 9 | 27.61 | 0.03 | 0.24 | 0.21 | | 17 Industry | -µ/σ | 90 | 115 | 5 | 59.73 | -2.96 | 2.27 | 5.23 | | | | 95 | 430 | 7 | 48.54 | -2.96 | 2.43 | 5.39 | | | | 99 | 10,178 | 9 | 21.68 | -2.96 | 5.02 | 7.98 | | | -µ+0.5σ² | 90 | 112 | 4 | 59.96 | -0.02 | 0.03 | 0.05 | | | | 95 | 408 | 7 | 48.99 | -0.02 | 0.07 | 0.09 | | | | 99 | 8,291 | 8 | 23.43 | -0.02 | 0.07 | 0.09 |
结果显示,在95%置信水平下,加密货币市场的SCS规模(122个组合)显著小于行业组合(430个组合)。这似乎与加密货币高波动性的直觉相悖。由于两个数据集的资产总数 N 不同(16 vs 17),导致可行投资组合的总数 |S| 存在巨大差异,因此绝对规模 |Ŝα| 的直接比较可能产生误导。相对多样性指数(RMI)通过对总规模进行标准化,提供了一个更公允的不确定性度量。RMI指标证实了加密货币市场的选择不确定性更低(RMI为56.68% vs. 48.54%)。一个可能的原因是,加密货币市场可能由少数主导性资产(如比特币)驱动,这限制了表现接近最优的组合数量。相比之下,成熟行业之间存在更强的替代性,导致大量组合表现相似,从而放大了选择的不确定性。
将置信水平从95%提高到99%,SCS的规模急剧扩大(例如,加密货币市场从122增至8,128),RMI也大幅下降。这揭示了覆盖率和选择性之间存在根本性的权衡:更高的置信度保证了覆盖率,但代价是牺牲了区分优劣策略的能力。然而,值得注意的是,下边界(LB)集的规模保持相对稳定,表明存在一个稳健的核心资产集。
6.3 资产重要性与共现模式
图3展示了各资产的纳入重要性(IIα)随 α 变化的轨迹。在L1-Crypto数据中,比特币(BTC)和Mantra(OM)等资产持续具有很高的IIα,表明它们在构建高夏普比率组合中扮演核心角色。在17行业数据中,石油和天然气(Oil & Gas)、钢铁(Steel)和建筑材料(Construction Materials)等部门占据主导地位。
图3: 左图为L1-Crypto数据集(夏普比率损失),右图为17行业数据集(均值-方差损失)。红线标记了经验最优组合中的资产。
SCS方法的一个关键优势在于,它能识别出那些虽未被纳入经验最优组合、但在整个SCS中系统性地重要的资产。例如,在L1-Crypto数据中,尽管比特币(BTC)不是经验最优组合的成员,但其IIα值非常高,表明它在大量接近最优的组合中都发挥着关键作用。这提供了比单点估计更丰富的结构性信息。
图4的共现重要性(CIIα)网络图进一步揭示了资产间的互补关系。在两个市场中,网络都表现出紧密的连接性。在加密货币市场,BTC和OM等资产具有高度的中心性。在行业市场,石油、钢铁等行业处于网络中心,反映了它们在构建稳健组合时强大的互补性。
图4: 在95%置信水平下的共现重要性图。左图为L1-Crypto数据集(夏普比率损失),右图为17行业数据集(均值-方差损失)。边的粗细代表共现重要性的大小。
实证分析表明,无论是在新兴的加密货币市场还是成熟的股票市场,都存在显著的选择不确定性。SCS及其配套的诊断工具为决策者提供了一个更稳健、信息更丰富的决策基础,超越了对单一最优组合的简单依赖。
--------------------------------------------------------------------------------
7. 结论
本文提出的选择置信集(SCS)框架,为投资组合理论中长期存在但往往未被量化的选择不确定性问题,提供了一个严谨的、可操作的解决方案。
核心贡献回顾
SCS的核心功能是识别出所有在统计上与真实最优解无法区分的投资组合。我们强调,当不确定性很高时,SCS的规模可能会很大。但这并非方法的缺陷,而是在高不确定性环境下保证覆盖率的统计必然性,它真实地反映了数据中不同策略之间的不可区分性。
主要发现总结
理论上,我们证明了SCS的渐近覆盖性和规模特性。实证上,通过模拟研究和对加密货币及行业数据的分析,我们揭示了在真实市场中普遍存在大量统计上等效的投资策略。这一发现凸显了传统上依赖单一“最优”点估计方法的局限性。
局限性与未来研究方向
* 局限性: 当前的分析假设资产数量 N 是固定的,这在高维(大 N)场景下构成了理论和计算上的挑战。
* 未来研究方向: 未来有几个值得探索的方向。首先,将该方法论扩展到高维环境。其次,探索改进SCS有限样本性能的方法,例如使用自举法或高阶修正。最后,研究如何融合经济学的先验知识或正则化方法,以便在不牺牲覆盖率的前提下缩小SCS的规模。
最终陈述
本文的研究成果推动了投资组合选择的范式,从依赖单一的“最优”点估计,转向对一系列合理备选方案的分布特征进行刻画。我们引入的诊断工具,如相对多样性指数(RMI)、资产纳入重要性(IIα)和共现网络,为从业者评估投资组合的稳健性、指导多样化选择以及理解选择模糊性的程度,提供了实用的、有原则的指导。
--------------------------------------------------------------------------------
参考文献
Amendola, A., Braione, M., Candila, V., and Storti, G. (2020). A model confidence set approach to the combination of multivariate volatility forecasts. International Journal of Forecasting, 36(3):873–891.
Andrews, D. W. (1991). Heteroskedasticity and autocorrelation consistent covariance matrix estimation. Econometrica: Journal of the Econometric Society, pages 817–858.
Ardia, D. and Boudt, K. (2018). The peer performance ratios of hedge funds. Journal of Banking & Finance, 87:351–368.
Caparrini, A., Arroyo, J., and Escayola Mansilla, J. (2024). S&p 500 stock selection using machine learning classifiers: A look into the changing role of factors. Research in International Business and Finance, 70:102336.
DeMiguel, V., Garlappi, L., and Uppal, R. (2009). Optimal versus naive diversification: How inefficient is the 1/n portfolio strategy? The review of Financial studies, 22(5):1915–1953.
Ferrari, D. and Yang, Y. (2015). Condence sets for model selection by f-testing. Statistica Sinica, pages 1637–1658.
Hansen, P., Lunde, A., and N. J.M. (2011). The model confidence set. Econometrica, 79(2):453–497.
Ledoit, O. and Wolf, M. (2008). Robust performance hypothesis testing with the sharpe ratio. Journal of Empirical Finance, 15(5):850–859.
Lee, S. I. (2020). Deeply equal-weighted subset portfolios. arXiv preprint arXiv:2006.14402.
Lehmann, E. L. and Romano, J. P. (2005). Testing statistical hypotheses. Springer.
Markowitz, H. (1952). Portfolio selection. The Journal of Finance, 7(1):77–91.
Memmel, C. (2003). Performance hypothesis testing with the sharpe ratio. Finance Letters, 1(1): 21–23.
Zheng, C., Ferrari, D., and Yang, Y. (2019). Model selection confidence sets by likelihood ratio testing. Statistica Sinica, 29(2):827–851.


