加密货币波动率的概率性预测方法比较分析

加密货币波动率的概率性预测方法比较分析

摘要 (Abstract)

加密货币市场以其极端的波动性为特征,这使得传统的确定性(点)预测方法在进行有效的风险管理时显得力不从心。本文旨在解决这一局限性,通过引入多种概率性预测方法,将一系列基础模型的点预测转化为能够捕捉未来结果完整分布的概率性分位数预测。我们提出了三种核心方法:基于残差模拟的分位数估计 (Quantile Estimation through Residual Simulation, QRS)、分位数线性回归 (Quantile Linear Regression, QLR) 和分位数回归森林 (Quantile Regression Forest, QRF)。关键的实证研究结果表明,基于对数变换数据的线性基础模型应用的 QRS 方法,在各项评估指标上始终优于其他更复杂的替代方案。本研究为加密货币波动率建模和金融风险管理领域填补了重要的理论空白,并提供了具有实践价值的概率性预测方法。

1. 引言 (引言)

由于加密货币市场存在巨大的不确定性和频繁的极端价格波动,对波动率进行概率性预测至关重要。与传统的点预测不同,概率性方法旨在估计未来波动率的整个条件分布(或通过密集间隔的分位数进行精细近似),从而捕捉所有潜在的结果范围,显著提升在这些高度不可预测市场中的风险评估与决策制定能力。

尽管概率性预测具有明显优势,但在加密货币波动率研究领域中,相关方法仍然相对稀缺。为填补这一空白,本研究提出了新颖的概率性预测方法,旨在通过利用多个基础模型的确定性预测结果,生成全面且能反映不确定性的分位数预测。

本研究的核心动机源于加密货币市场固有的高波动性和不可预测的价格行为,以及现有确定性预测方法的局限性。我们的主要贡献包括:

* 点预测到概率预测的转化:我们提出了将加密货币波动率的确定性点预测转化为概率性(基于分位数)预测的方法,有效捕捉市场的内在不确定性。
* 概率性堆叠法:我们将经典的确定性堆叠法(stacking)扩展至概率性领域,采用分位数线性回归 (QLR) 和分位数回归森林 (QRF) 作为元模型,以生成分位数预测。
* 多样化的基础模型集成:我们利用了十二个基础模型,涵盖了从经典统计方法(如 HAR、GARCH)到现代机器学习算法(如 SVR、随机森林、LSTM)的广泛范围。
* 全面的评估框架:我们采用了一套稳健的评估指标,包括连续排序概率评分 (Continuous Ranked Probability Score, CRPS)、相对频率 (Relative Frequency) 和温克勒分数 (Winkler Score),对所提出的方法进行了系统性的评估和比较。

本文的后续结构安排如下:第二章介绍所使用的数据集并阐述预测问题。第三章详细描述所提出的概率性预测方法。第四章介绍实验设计与评估。第五章呈现实证结果并进行讨论。第六章总结全文并提出未来研究方向。

2. 数据与问题陈述 (Data and Problem Statement)

本章节旨在介绍研究中使用的数据集、关键变量的构建方式,并从数学上定义概率性预测问题,为后续的方法论和实验分析奠定基础。

数据描述

本研究的实验数据来源于 Kraken 交易所的比特币(BTC/USD)交易对,时间跨度为 2017 年至 2021 年。

已实现方差 (Realized Variance, RV)

我们使用 5 分钟的日内回报数据来估算每日已实现方差 (RVd,t),计算公式如下:

RV_{d,t} = \sum_{k=1}^{K} r_{k,t}^2, \quad r_{k,t} = \ln P_{k,t} - \ln P_{k-1,t} \quad (1)

其中,K 是一天内日内回报的观测次数(在我们的案例中为 288 次),rk,t 是第 t 天的第 k 次日内回报,Pk,t 是比特币在第 t 天第 k 个观测点的价格。

数据转换

原始的 RVd 数据序列呈现出多个尖峰(异常值),这对预测模型构成了挑战。因此,模型通常在对数转换后的数据 (lnRVd) 上运行,这种转换有助于稳定方差,使数据分布更接近正态。

问题公式化

加密货币 RV 的概率性预测目标是估计未来波动率的整个条件分布,而不仅仅是提供一个单一的点预测值。在本研究的框架下,我们的具体目标是进行分位数预测:即基于 n 个基础模型的点预测 ŷt = [ŷ1,t, ..., ŷn,t] 来估计条件分位数 ŷq,t。

元模型(meta-model)可以处理两种类型的数据:一种是原始数据(RVd),另一种是经过对数转换的数据(lnRVd),后者在实验中以后缀 -l 标记。为了进一步提升性能,我们还考虑在元模型中加入额外的输入变量,即每日、每周和每月的已实现方差。包含这些额外输入的模型以后缀 -e 标记。

在明确了数据和问题定义之后,下一章节将详细介绍用于解决此问题的三种核心概率预测方法。

3. 概率性预测方法 (Probabilistic Forecasting Approaches)

本章节将详细阐述三种用于将点预测转化为概率性预测的核心方法。每种方法都旨在根据基础模型的点预测,以 99 个分位数(q 从 0.01 到 0.99)的形式构建第二天的预测分布。

3.1 基于残差模拟的分位数估计 (Quantile Estimation through Residual Simulation - QRS)

QRS 方法的核心思想是利用基础预测模型的历史预测误差(即残差)来估计未来预测的不确定性。该方法假设历史误差的分布能够代表未来预测的不确定性。

QRS 的操作流程可分为以下几个步骤:

1. 基础模型预测:首先,训练一个确定性的点预测模型,用于生成历史时期和未来时刻的点预测值 ŷt。
2. 残差计算:根据历史预测值和真实值计算预测误差(残差): e_t = y_t - \hat{y}_t \quad (2)
3. 模拟预测分布:通过将历史残差集合加到当前的预测值 ŷτ 上,生成一个潜在未来值的经验分布: \tilde{y}{\tau} = \hat{y}{\tau} + e_t \quad (3) 这构成了一个模拟的未来值集合: \Lambda = {\hat{y}{\tau} + e_1, \hat{y}{\tau} + e_2, ..., \hat{y}{\tau} + e{\tau-1}} \quad (4)
4. 分布函数拟合:为了从这个离散的经验分布中获得平滑的概率分布,我们采用非参数的核密度估计方法(使用高斯核)来拟合该分布。
5. 分位数估计:最后,从拟合的分布中通过其逆累积分布函数 (inverse CDF) 提取所需的分位数。

优缺点分析:QRS 方法的优点在于其数据驱动和模型无关性,可适用于任何点预测模型。同时,它计算高效,实现简单。然而,其主要缺点是假设历史残差能准确代表未来的不确定性,在市场条件剧烈变化时这一假设可能不成立。此外,该方法可能会继承基础模型的系统性偏差。

3.2 分位数线性回归 (Quantile Linear Regression - QLR)

分位数线性回归 (QLR) 是一种直接估计响应变量条件分位数的统计方法,与传统的估计条件均值的普通最小二乘法 (OLS) 形成对比。它对于处理非正态或存在异常值的数据尤为有效。

QLR 采用线性模型形式来估计特定分位数: f(\hat{y}) = \sum_{i=1}^{n} a_i \hat{y}_i + a_0 \quad (5) 其中,模型系数 a0, ..., an 通过最小化“弹球损失函数”(pinball loss function)来估计: L_q(y, \hat{y}_q) = \begin{cases} (y - \hat{y}_q)q & \text{if } y \ge \hat{y}_q \ (y - \hat{y}_q)(q - 1) & \text{if } y < \hat{y}_q \end{cases} \quad (6) 其中 y 是真实值,ŷq 是其预测的 q-分位数。

优缺点分析:QLR 的主要优点是对异常值不敏感,且能够提供比单一均值预测更丰富的数据分布信息。但其局限性也十分明显:它假设预测变量与分位数之间存在线性关系,这在处理高度非线性的金融数据时可能导致估计不准确。此外,为每个分位数训练一个独立的模型导致计算成本较高。

3.3 分位数回归森林 (Quantile Regression Forest - QRF)

分位数回归森林 (QRF) 是著名的随机森林 (RF) 算法在概率性回归任务上的扩展,旨在估计响应变量的整个条件分布,而不仅仅是其均值。

QRF 的核心机制与标准 RF 类似,由多个决策树集成而成。不同之处在于,RF 通常对每个叶节点内的观测值取平均得到点预测,而 QRF 则保留每个叶节点内所有观测值的完整分布。通过以下公式计算经验累积分布函数 (CDF) 来估计分位数: \hat{F}(y|X = \hat{y}) = \sum_{t \in \Psi} w_t(\hat{y}) \mathbf{1}{{y_t \le y}} \quad (7)w_t(\hat{y}) = \frac{1}{p} \sum{j=1}^{p} \frac{\mathbf{1}{{\hat{y}{\kappa \in \Psi} \mathbf{1}{{\hat{y}_\kappa \in \ell_j(\hat{y})}}} \quad (8) 其中,权重 wt 决定了每个训练样本对经验 CDF 的贡献,p 是森林中树的数量,ℓj 表示样本 ŷ 在第 j 棵树中落入的叶节点。

优缺点分析:QRF 的主要优势在于其非参数性,能够灵活地建模复杂的非线性关系。然而,它的缺点也相当突出:计算成本高昂,因为它需要在每个叶节点存储和分析完整的响应分布。此外,QRF 的性能对超参数(如树的数量、叶节点的最小样本数)非常敏感,需要仔细调优。

在详细介绍了这三种概率性预测方法之后,下一章节将展示它们的实验设计和实证结果。

4. 实验设计与评估 (Experimental Design and Evaluation)

本章将详细介绍用于比较 QRS、QLR 和 QRF 性能的实验框架,内容涵盖所使用的基础模型、训练与优化设置,以及用于系统性评估预测质量的各项指标。

4.1 基础模型 (Base Models)

本研究采用了 12 个基础模型,这些模型在先前的研究中已被用于加密货币 RV 的点预测。它们涵盖了从经典统计到现代机器学习的多种方法:

* HAR: 异质自回归模型 (Heterogeneous AutoRegressive model)
* HAR-R: 稳健估计的异质自回归模型 (Heterogeneous AutoRegressive model with Robust estimation)
* ARFIMA: 自回归分数阶积分移动平均模型 (AutoRegressive Fractionally Integrated Moving Average model)
* GARCH: 广义自回归条件异方差模型 (Generalized AutoRegressive Conditional Heteroscedasticity model)
* LASSO: 最小绝对收缩和选择算子模型 (Least Absolute Shrinkage and Selection Operator model)
* RR: 岭回归 (Ridge Regression)
* SVR-G: 高斯核支持向量回归 (Support Vector Regression with a Gaussian kernel)
* SVR-L: 线性核支持向量回归 (Support Vector Regression with a Linear kernel)
* MLP: 多层感知机神经网络 (Multi-Layer Perceptron neural network)
* FNM: 模糊邻域模型 (Fuzzy Neighborhood Model)
* RF: 随机森林 (Random Forest)
* LSTM: 长短期记忆神经网络 (Long Short-Term Memory neural network)

4.2 训练与优化设置 (Training and Optimization Setup)

实验的时间窗口划分为:基础模型在 2019 年至 2021 年期间生成每日的超前一步点预测。其中,2021 年全年的数据(共 365 天)作为概率性模型的测试集。

对于测试集中的每一天,概率性模型都会独立进行一次训练。其训练数据包含了从 2019 年初到该预测日之前一天的所有历史观测值。训练完成后,模型为当天预测 99 个分位数(从 0.01 到 0.99)。

各模型的具体设置如下:

* QRS: 该方法分别在原始 RV 和对数 RV (-l 后缀) 上运行。我们还为基础模型的均值 (Ens-Mean) 和中位数 (Ens-Med) 创建了集成版本。在处理原始 RV 数据时,Matlab 的 icdf 函数在计算高分位数(如 0.98, 0.99)时偶尔会收敛失败。对于这些情况(发生率低于 1%),我们采用分段三次 Hermite 插值法来估算缺失的分位数。
* QLR 和 QRF: 这两种模型均测试了四种变体:在对数 RV 上运行 (-l)、在对数 RV 上运行并加入额外输入 (-le)、在原始 RV 上运行 (raw)、在原始 RV 上运行并加入额外输入 (-e)。这四种变体旨在系统性地检验第二章中讨论的数据转换(对数变换)和附加信息(历史RV)对这两种高级集成方法性能的实际影响。对于 QLR,我们使用了 Roger Koenker 提供的 Matlab 实现,通过内点法求解线性规划问题。
* QRF: 我们将森林中的树的数量设置为 100,每次分裂时随机选择的预测变量数为总数的 1/3。唯一优化的超参数是每个叶节点的最小观测数,该参数通过袋外误差 (out-of-bag error) 在 {1, 5, 10, ..., 70} 集合中进行选择。

4.3 评估指标 (Evaluation Metrics)

连续排序概率评分 (Continuous Ranked Probability Score, CRPS) CRPS 是评估概率性预测整体质量的常用指标。它可以通过弹球损失函数进行近似计算: CRPS(F, y) \approx \sum_{q \in \Pi} L_q(y, \hat{y}_q) \quad (9) 其中 Π 是分位数水平的集合,ŷq 是预测的 q-分位数。CRPS 值越低,表示预测性能越好。

相对频率 (Relative Frequency, ReFr) 与平均绝对 ReFr 误差 (MARFE) 相对频率用于评估预测的校准度,即预测分位数与实际观测值的匹配程度。其计算公式为: ReFr(q) = \frac{1}{N} \sum_{i=1}^{N} \mathbf{1}{{y_i \le \hat{y}{q,i}}} \quad (10) 理想情况下,ReFr(q) 应等于 q。我们使用平均绝对 ReFr 误差 (MARFE) 来量化整体的校准偏差: MARFE = \frac{1}{|\Pi|} \sum_{q \in \Pi} |ReFr(q) - q| \quad (11) MARFE 值越低,表示校准度越好。

温克勒分数 (Winkler Score, WS) 温克勒分数用于评估预测区间 (Prediction Interval, PI) 的质量,它同时考虑了区间的宽度和覆盖率。其定义如下: WS = \begin{cases} (\hat{y}{qu} - \hat{y}{ql}) + \frac{2}{q} (\hat{y}{ql} - y) & \text{if } y < \hat{y}{ql} \ (\hat{y}{qu} - \hat{y}{ql}) & \text{if } \hat{y}{ql} \le y \le \hat{y}{qu} \ (\hat{y}{qu} - \hat{y}{ql}) + \frac{2}{q} (y - \hat{y}{qu}) & \text{if } y > \hat{y}{qu} \end{cases} \quad (12) 其中 ŷql 和 ŷqu 分别是区间的下界和上界。本研究评估的是 90% 预测区间的平均温克勒分数 (MWS),其计算公式为: MWS = \frac{1}{N} \sum_{i=1}^{N} WS(y_i, \hat{y}{ql,i}, \hat{y}{qu,i}) \quad (13) MWS 值越低,表示预测区间的质量越高。

点预测误差 (MAE-Q 和 MSE-Q) 通过将中位数(q=0.5)作为点预测,我们可以评估其准确性: MAE-Q = \frac{1}{N} \sum_{i=1}^{N} |y_i - \hat{y}{0.5,i}| \quad (14)MSE-Q = \frac{1}{N} \sum{i=1}^{N} (y_i - \hat{y}_{0.5,i})^2 \quad (15)

实验设置和评估标准已明确,下一章将呈现详细的实证结果。

5. 实证结果与讨论 (Empirical Results and Discussion)

本章节将系统地呈现和分析实验结果。我们将使用上一章节定义的评估指标,从多个维度对 QRS、QLR 和 QRF 三种方法的性能进行深入比较,并对关键发现进行讨论。

5.1 总体性能比较:CRPS 分析

表1:各概率性预测模型的关键性能指标

模型类别 (Approach/Model) 平均CRPS (Mean CRPS) CRPS中位数 (Median CRPS) 平均温克勒分数 (MWS)
QRS-l (HAR-l) 9.53E-04 3.54E-04 1.16E-02
QRS-l (RR-l) 9.45E-04 3.56E-04 1.13E-02
QRS-l (SVR-L-l) 9.48E-04 3.70E-04 1.13E-02
QRS (Ens-Mean) 9.83E-04 2.78E-04 1.29E-02
QLR-l 9.57E-04 3.48E-04 1.12E-02
QRF-l 9.76E-04 3.24E-04 1.11E-02
QRF 9.81E-04 3.26E-04 1.11E-02

从表1数据可以清晰地看出,QRS-l 变体(即在对数 RV 上操作的 QRS 方法)中的模型,特别是与线性基础模型(如 HAR-l, RR-l, SVR-L-l)相结合时,在平均 CRPS 指标上表现最佳。

对 CRPS 进行的 Diebold-Mariano 统计显著性检验结果进一步证实了这一发现。检验表明,QRS-l 类别中的顶尖模型在统计上显著优于大多数其他模型。相比之下,基于 GARCH 和 LSTM 的模型表现最差,其性能被大多数其他模型所超越。

对比 QRS(在原始 RV 上操作)和 QRS-l 的 CRPS 表现可以发现一个有趣的现象:QRS-l 的平均 CRPS 更低,但中位数 CRPS 更高。这表明对数变换有效地抑制了极端异常值对均值的影响,从而提高了模型的整体稳健性,尽管在非极端情况下其预测误差的中位数可能略高。

QLR 和 QRF 作为更复杂的集成方法,其性能与顶尖的 QRS-l 模型相当,但并未实现超越。这表明在当前任务中,增加模型的复杂性并未带来显著的性能提升。

5.2 校准度与预测区间质量分析

校准图分析显示,QRS-l、QLR 和 QRF 模型倾向于低估较低的分位数(即它们的预测值低于实际值),而 QRS(在原始数据上操作)模型则倾向于低估较高的分位数。

根据 MARFE 指标(衡量校准度的指标),基于 RR 模型的 QRS 变体(在原始数据上)校准度最高,其 MARFE 值为所有模型中最低的 0.0262。

关于 90% 预测区间的分析揭示:

* 在原始数据上运行的 QRS 模型生成的预测区间通常过窄,未能充分捕捉波动的不确定性。
* QRS-l、QLR 和 QRF 模型生成的预测区间虽然在 MWS 指标上更优,但普遍存在过宽且向下偏移的问题。更具体地说,观测值低于预测区间的比例远低于期望的 5%,而高于区间的比例则远超 5%。

5.3 方法论层面的观察

* 对数变换的影响:综合来看,对数变换在稳定方差和降低异常值影响方面具有显著的积极作用,这体现在更优的平均 CRPS 和 MWS 指标上。然而,在某些指标上(如中位数 CRPS 和 MARFE),直接在原始数据上操作的模型表现更佳。这表明数据预处理方法的选择存在权衡。
* 分位数交叉问题:QLR 方法在约 12% 的预测中出现了分位数交叉问题(即低分位数的预测值高于高分位数的预测值),这是一个严重的理论缺陷。相比之下,QRS 和 QRF 的设计从根本上避免了此问题的发生。
* 附加输入的影响:在 QLR 和 QRF 模型中,加入额外的输入变量(每日、每周、每月的 RV)并未能提升预测性能。一个可能的解释是,这些信息已经被基础模型的点预测所捕获,再次加入反而可能引入噪声或导致特征冗余。

5.4 计算效率与基础模型重要性

三种方法的计算效率差异巨大。在我们的实验平台上,生成一次预测的近似运行时间为:

* QRS: 0.015 秒
* QLR: 0.8 秒
* QRF: 0.4 秒

QRS 在速度和效率上具有无与伦比的优势,因为它不涉及复杂的模型训练过程。QLR 的计算成本最高,这直接源于其方法论:为得到 99 个分位数,它需要独立求解 99 个线性规划问题,这极大地增加了计算负担。QRF 虽然也较慢,但一次训练即可得到所有分位数。

在使用 QRF-l 方法进行基础模型重要性评估时,结果显示 SVR-L、RR 和 SVR-G 被识别为最重要的三个基础模型。而 LSTM、LASSO 和 MLP 等模型的预测对于最终的概率性预测贡献较小。

5.5 结果讨论 (Discussion of Results)

本研究的实证结果表明,概率性堆叠法可被有效地应用于将点预测转化为概率性预测。所评估的三种方法各有其独特的优势与局限性。

* QRS 的稳健性:QRS-l 方法(即在对数变换数据上应用 QRS)表现出色的原因可归结为三个关键因素的协同作用:(1) 对数变换有效地稳定了数据方差,使其更适合线性模型;(2) 基于经验残差的非参数不确定性表示,能够灵活地捕捉预测误差的真实分布,而无需强加任何分布假设;(3) 方法的简单性降低了过拟合的风险,使其在数据量有限或噪声较大的环境中表现稳健。
* QLR 的局限性:QLR 的性能受限于其固有的线性假设。在波动剧烈、非线性特征显著的加密货币市场中,这一假设难以成立。此外,频繁出现的分位数交叉问题不仅是理论上的缺陷,也给实际应用带来了困扰,限制了其可靠性。
* QRF 的权衡:QRF 在捕捉复杂的非线性关系方面具有理论优势。然而,这种优势是以高昂的计算成本和对超参数的敏感性为代价的。在实际应用中,寻找最优超参数的挑战以及较长的训练时间,使得其相对于更简单的方法并未展现出压倒性的性能优势。

一个核心的发现是,在加密货币波动率预测这一复杂问题中,一个概念简单、计算高效的方法(如 QRS),当与精心选择的线性基础模型和恰当的数据变换相结合时,其性能可以匹敌甚至超越更复杂的非线性集成方法(如 QRF)。这提示研究者和实践者,不应盲目追求模型的复杂性,而应更注重基础模型的质量和数据预处理的有效性。

此外,附加输入变量(如历史周度和月度 RV)未能提升模型性能,这一结果引发了对集成学习中特征工程的深刻反思。它表明,当基础模型的预测本身已经蕴含了丰富信息时,简单地叠加原始特征可能会导致信息冗余,甚至引入噪声。这强调了在构建元模型时,理解基础预测所包含的信息内容至关重要。

6. 结论与未来工作 (结论 and Future Work)

结论总结

本研究针对加密货币波动率预测中传统确定性(点)预测方法的不足,成功提出并系统性地评估了三种将点预测转化为概率性预测的方法。我们的分析旨在为捕捉市场不确定性提供更全面的工具。

核心结论非常明确:基于残差模拟的 QRS 方法,特别是当应用于经过对数变换的数据和简单的线性基础模型时,为比特币波动率提供了最稳健、准确且计算高效的概率性预测。 尽管 QLR 和 QRF 等更复杂的堆叠方法也能提供有价值的分位数预测,但它们的整体表现并未超越设计更简单的 QRS 方法。

本研究提出的概率性堆叠框架,通过将多个模型的预测结果集成为一个完整的概率分布,有效捕捉了市场的内在不确定性,填补了加密货币波动率预测文献中的一个重要空白。

未来工作

为进一步推动该领域的研究,我们提出以下几个潜在的未来工作方向:

* 自适应概率预测框架:探索能够动态适应不同市场波动机制的自适应概率预测框架。此类框架可以在市场极端事件期间自动调整其不确定性估计,从而提升预测的稳定性。
* 整合外部预测因素:将市场情绪指标、社交媒体数据或宏观经济指标等外部预测因素整合到概率性堆叠框架中,以检验它们是否能提供额外的信息,从而提高预测的准确性。
* 扩展预测范围与方法:将本文提出的方法扩展到多步超前波动率预测,以满足更长期的风险管理需求。此外,探索基于深度学习的概率性方法(如变分自编码器或概率性神经网络)可能为捕捉更复杂的依赖关系带来新的突破。

7. 致谢与参考文献 (Acknowledgment and References)

致谢 (Acknowledgment)

本研究得到了波兰国家科学中心(P.F.:项目号 2021/43/B/HS4/00353,W.O.:项目号 2019/35/B/HS4/00642)和布拉格经济与商业大学(P.F.:项目号 IP100040)的资金支持。

参考文献 (References)

[1] E. Bouri, S. J. H. Shahzad, and D. Roubaud, “Co-explosivity in the cryptocurrency market,” Finance Research Letters, vol. 29, pp. 178–183, 2019. [2] L. Ø. Bergsli, A. F. Lind, P. Molnár, and M. Polasik, “Forecasting volatility of Bitcoin,” Research in International Business and Finance, vol. 59, p. 101540, 2022. [3] O. B. Sezer, M. U. Gudelek, and A. M. Ozbayoglu, “Financial time series forecasting with deep learning: A systematic literature review: 2005–2019,” Applied Soft Computing, vol. 90, p. 106181, 2020. [4] G. Dudek, P. Fiszeder, P. Kobus, and W. Orzeszko, “Forecasting cryptocurrencies volatility using statistical and machine learning methods: A comparative study,” Applied Soft Computing, vol. 151, p. 111132, 2024. [5] S. Nadarajah, J. C. Mba, P. Rakotomarolahy, and H. T. J. E. Ratolojanahary, “Ensemble learning and an adaptive neuro-fuzzy inference system for cryptocurrency volatility forecasting,” Journal of Risk and Financial Management, vol. 18, p. 52, 2025. [6] W. Kristjanpoller and M. C. Minutolo, “A hybrid volatility forecasting framework integrating GARCH, artificial neural network, technical analysis and principal components analysis,” Expert Systems with Applications, vol. 109, pp. 1–11, 2018. [7] A. Golnari, M. H. Komeili, and Z. Azizi, “Probabilistic deep learning and transfer learning for robust cryptocurrency price prediction,” Expert Systems with Applications, vol. 255, p. 124404, 2024. [8] S. Hong, S. An, and J.-J. Jeon, “Cryptocurrency price forecasting using variational autoencoder with versatile quantile modeling,” in Proceedings of the 33rd ACM International Conference on Information and Knowledge Management, 2024, pp. 4530–4537. [9] G. Dudek, “Stacking for probabilistic short-term load forecasting,” in Computational Science – ICCS 2024, 2024, pp. 3–18. [10] S. Aras, “Stacking hybrid GARCH models for forecasting Bitcoin volatility,” Expert Systems with Applications, vol. 174, p. 114747, 2021. [11] R. Koenker and K. F. Hallock, “Quantile regression,” Journal of Economic Perspectives, vol. 15, no. 4, pp. 143–156, 2001. [12] N. Meinshausen, “Quantile regression forests,” Journal of Machine Learning Research, vol. 7, pp. 983–999, 2006. [13] S. Makridakis et al., “The M5 uncertainty competition: Results, findings and 结论s,” International Journal of Forecasting, vol. 38, pp. 1365–1385, 2022. [14] J. Brehmer and T. Gneiting, “Scoring interval forecasts: Equal-tailed, shortest, and modal interval,” Bernoulli, vol. 27, no. 3, pp. 1993–2010, 2021.