金融时间序列的复杂性:多重分形与多尺度熵分析
摘要
本研究采用多重分形去趋势波动分析(MF-DFA)与改进复合多尺度样本熵(RCMSE)两种方法,对四种金融资产——比特币、英镑/美元、黄金和天然气的价格对数收益率时间序列的复杂性进行了比较研究。该分析旨在深入揭示这些市场的可预测性与相关风险。每种工具都为量化时间序列的复杂性提供了独特的视角。RCMSE和MF-DFA的分析结果共同表明,比特币时间序列的复杂性显著高于其他资产。研究表明,比特币的高复杂性归因于其对数收益率序列中更强的非线性相关性。
关键词
关键词:多尺度熵,多重分形,样本熵,时间序列分析
--------------------------------------------------------------------------------
1. 引言 (引言)
在现代金融市场中,资产价格时间序列呈现出复杂的动态行为。精确地量化这种复杂性,对于风险评估、市场预测和投资决策制定具有至关重要的战略意义。随着科学技术的发展,研究人员已经开发出多种方法来衡量时间序列的复杂性,为我们理解市场深层结构提供了有力的工具。
衡量时间序列复杂性的科学方法多种多样,包括李雅普诺夫指数、分形维数和熵等。其中,熵作为一种度量系统信息含量与不确定性的指标,已成为一种广受欢迎的分析工具。其理论渊源可追溯至1948年香农在其开创性著作《通信的数学理论》中首次将熵的概念应用于信号和时间序列分析。
基于香农的理论,一系列用于度量时间序列熵的分析工具应运而生,例如近似熵和样本熵。这些方法已被广泛应用于金融市场研究。然而,传统的单尺度熵分析存在一个核心悖论:一个完全随机的白噪声序列会产生很高的熵值,但其动态结构却极为简单。为解决此问题,即区分“无序的随机性”与“有结构的复杂性”,Costa等人提出了多尺度熵(MSE)方法,通过在多个时间尺度上进行分析来量化复杂性。MSE方法的有效性已在多个领域得到验证,例如,它被用于区分周末与工作日的交通数据流量,分析生物信号以区分不同疾病状态,以及比较亚洲、欧洲和美洲金融市场的效率差异。
除熵方法外,分形分析是衡量复杂性的另一重要途径。去趋势波动分析(DFA)是一种能够有效检测非平稳时间序列中长程相关性的方法。然而,单一的分形标度行为往往不足以全面描述金融序列的复杂动态。因此,作为DFA的扩展,多重分形去趋势波动分析(MF-DFA)被提出,它能够提供更全面的多尺度标度行为描述,区分由长程相关性和宽概率密度函数引起的多重分形性。MF-DFA已成功应用于分析经济政策不确定性(EPU)与原油及股票市场的关系,以及评估加密货币和外汇市场的高频数据复杂性。
本研究旨在结合运用多重分形去趋势波动分析(MF-DFA)和一种改进的熵分析方法——改进复合多尺度样本熵(RCMSE)。之所以选择RCMSE,是为了克服传统MSE方法在处理较短金融时间序列时遇到的限制。金融数据序列通常长度有限,这使得MSE在较大尺度上计算出的熵值可能未定义或不准确。RCMSE通过改进的算法,专为短时间序列设计,显著提高了分析的稳健性。我们相信,结合MF-DFA和RCMSE,能够从可预测性和分形特征这两个金融系统的基本维度,为市场复杂性提供更深刻的洞见。
本文的组织结构如下:第二部分将详细介绍本研究采用的计算方法;第三部分描述所使用的数据及其来源;第四部分呈现实证分析结果;最后,第五部分对全文进行总结。本节的阐述为后续章节对具体研究方法的详细介绍奠定了基础。
2. 研究方法 (Methodology)
为确保对金融市场复杂性分析的准确性和深度,选择并清晰阐释稳健的定量分析方法是至关重要的。本研究采用了两种互补的核心分析工具:改进复合多尺度样本熵(RCMSE)和多重分形去趋势波动分析(MF-DFA)。下文将对这两种方法的理论基础和计算步骤进行详细说明。
2.1 样本熵 (Sample Entropy)
样本熵(SampEn)用于评估数据点模式在特定长度上保持相似性的概率。对于一个包含N个数据点的时间序列 x = {x1, ..., xN},其样本熵的计算流程如下:
1. 构建嵌入向量:构建 N-m+1 个长度为m的重叠嵌入向量 Xm(i):
2. 定义向量距离:使用以下公式确定任意两个向量之间的距离:
3. 统计匹配向量数:对于一个预设的容差 r(通常取时间序列标准差的一小部分),统计距离 d[Xm(i), Xm(j)] 小于或等于 r 的m维向量对的总数,记为 nm。
4. 增加维度并重复:将嵌入维度增加到 m+1,重复步骤1至3,得到 m+1 维的匹配向量总数,记为 nm+1。
5. 计算样本熵:样本熵最终由以下公式定义:
需要注意的是,样本熵算法在处理短时间序列时可能遇到问题。如果 nm 或 nm+1 为零,熵值将无法定义。为确保结果的有效性,时间序列的长度通常需要在 10m 到 30m 之间。
2.2 多尺度样本熵 (Multiscale Sample Entropy - MSE)
多尺度样本熵(MSE)的核心思想是通过一个“粗粒化”过程,在多个时间尺度上计算样本熵,而非局限于单一尺度。对于给定的时间序列 x,其粗粒化序列 y(τ) 按以下公式计算:
y(τ)j = (1/τ) * Σ(xi) 从 i=(j-1)τ+1 到 jτ,其中 1 ≤ j ≤ N/τ (4)
此处的 τ 是尺度因子。当 τ=1 时,粗粒化序列即为原始序列。随着 τ 的增加,序列的长度相应缩短。
2.3 改进复合多尺度样本熵 (Refined Composite Multiscale Sample Entropy - RCMSE)
RCMSE是MSE的一种改进版本,旨在提高其在短时间序列分析中的适用性。它通过改进粗粒化过程来解决传统MSE在较大尺度上容易出现熵值未定义的问题。具体而言,对于一个尺度因子 τ,RCMSE会生成 τ 个粗粒化序列。第 k 个粗粒化序列 y(τ)k 的定义如下:
y(τ)(k,j) = (1/τ) * Σ(xi) 从 i=(j-1)τ+k 到 jτ+k-1,其中 1 ≤ j ≤ N/τ, 1 ≤ k ≤ τ (5)
随后,对这 τ 个粗粒化序列分别计算其 m 维和 m+1 维的匹配向量数,并对这些数值进行平均。RCMSE的最终计算公式为:
RCMSE(x, τ, m, r) = -ln(Σ(nm+1(k,τ)) / Σ(nm(k,τ))),其中求和范围为 k 从1到 τ (6)
通过对所有粗粒化序列的匹配向量数进行求和,RCMSE仅在所有 nm 或 nm+1 同时为零时才会出现未定义的情况,从而大大降低了这种风险。
2.4 多重分形去趋势波动分析 (Multifractal Detrended Fluasion Analysis - MF-DFA)
MF-DFA是一种用于分析时间序列多重分形特征的强大工具。其分析过程可分为以下五个步骤:
1. 计算轮廓序列:首先,计算原始序列与其均值之差的累积和,得到轮廓序列 Y(i)。
2. 序列分段:将轮廓序列 Y(i) 分割成 Ns = int(N/s) 个长度为 s 的不重叠片段。为充分利用数据,该过程从序列的两端各进行一次,共得到 2Ns 个片段。
3. 局部去趋势:对每个片段,使用最小二乘法拟合一个多项式(例如线性、二次或三次多项式,分别对应DFA1, DFA2, DFA3)以确定其局部趋势,从而消除不同阶的非平稳性影响。然后,计算每个片段的方差。
4. 计算q阶波动函数:通过对所有片段的方差进行平均,得到q阶波动函数 Fq(s):
* Fq(s):这是一个核心函数,其对波动的敏感性由阶数 q 决定。当 q 为正时,该函数对大幅度波动更为敏感;当 q 为负时,则对小幅度波动更为敏感。这使得MF-DFA能够捕捉不同大小波动的标度行为。
5. 分析标度行为:通过分析 Fq(s) 与尺度 s 在双对数图上的关系,可以揭示序列的标度行为。如果存在长程幂律相关性,则 Fq(s) ∼ sh(q)。由此可以得到几个关键的多重分形指标:
* 广义赫斯特指数 h(q):描述了不同阶波动函数的标度行为。h(q) 对 q 的依赖性是多重分形存在的标志。
* 多重分形标度指数 τ(q):它与 h(q) 的关系为 τ(q) = qh(q) - 1 (12)。如果 τ(q) 是 q 的非线性函数,则表明序列具有多重分形特性。
* 奇异谱 f(α):通过勒让德变换从τ(q)得到奇异谱f(α),其参数α(赫尔德指数或奇异性强度)和f(α)由以下关系定义:α = dτ(q)/dq 且 f(α) = qα - τ(q) (13)。
* 经济学含义:小 α 值对应于时间序列中波动剧烈的“粗糙”区域,而大 α 值则对应于变化平稳的“平滑”区域。
* 奇异谱宽度 Δα = αmax - αmin:这是衡量时间序列多重分形强度和复杂性的关键指标。Δα 越大,表明序列的动力学结构越丰富,复杂性也越高。
有了这一套能够分别从可预测性(RCMSE)和内在结构(MF-DFA)两个维度解构复杂性的分析框架,我们接下来将这套方法应用于一组精心挑选的、具有显著不同市场特征的金融资产。
3. 数据描述 (Data Description)
为进行有意义的跨市场比较分析,精心选择具有不同特征的代表性资产是研究设计的基础。本研究旨在通过分析来自不同资产类别的数据,全面考察金融复杂性的表现形式。
资产选择与理由 本研究选取了四种关键的金融资产进行分析:
* 比特币 (Bitcoin):代表高波动性的加密货币市场。
* 英镑/美元 (GBP/USD):代表成熟且流动性强的外汇市场。
* 黄金 (Gold):代表传统的贵金属避险资产。
* 天然气 (Natural Gas):代表受季节性和地缘政治影响显著的大宗商品市场。
选择这些资产的理由在于它们覆盖了加密货币、外汇、贵金属和大宗商品等多个领域,每种资产都具有独特的波动性特征、市场驱动因素和投资者行为模式。这种多样性有助于我们全面考察复杂性在不同经济角色和投资者认知下的跨资产表现。
数据来源与规格 所有日度价格数据均来源于雅虎财经(Yahoo Finance)。为确保分析的一致性,每个时间序列的数据长度均被统一为3,730个数据点,数据截止日期为2024年12月2日。
数据处理 在金融时间序列分析中,使用对数收益率而非原始价格数据是一种标准做法。对数收益率能更准确地捕捉市场的相对波动和风险,并且具有更好的统计特性(如近似平稳性)。本研究中的对数收益率根据以下公式计算:
对数收益率 = ln(Pt) - ln(Pt-1) = ln(Pt / Pt-1) (15)
其中,Pt 是资产在时间 t 的收盘价,Pt-1 是前一交易日的收盘价。
数据准备工作的完成,为接下来的实证分析奠定了坚实的基础。下一章将详细呈现对这些处理后数据的分析结果。
4. 结果与分析 (Results and Analysis)
本章将运用前述的研究方法,对四种金融资产的对数收益率时间序列进行实证分析。通过RCMSE和MF-DFA两种工具的结合使用,本章旨在系统地揭示这四种资产在复杂性方面的共性与差异,并深入探讨其背后的市场动力学特征。
4.1 数据分布特征 (Data Distribution Characteristics)
首先,我们通过分析对数收益率的概率密度函数(PDFs)来考察其基本分布特征。结果显示,比特币和天然气的分布形态更宽,这直接反映了它们相较于英镑/美元和黄金而言具有更高的市场波动性。
为了更精确地量化分布的非正态性,我们计算了偏度、超额峰度和标准差,如下表所示:
指标 比特币 英镑/美元 黄金 天然气
偏度 (Skewness) -0.72 -0.88 -0.59 0.42
超额峰度 (ex-Kurtosis) 11.36 14.26 5.91 6.78
标准差 (Standard Deviation) 0.036 0.005 0.010 0.035
对上表的深入解读揭示了以下几点:
* 不对称性:偏度值衡量了收益分布的不对称性。天然气的正偏度(0.42)表明其更倾向于出现正收益,而比特币、英镑/美元和黄金的负偏度则意味着它们的下行价格波动更为常见。
* 尖峰厚尾特征:所有资产的超额峰度值均远大于零(正态分布的超额峰度为0),其中英镑/美元最高(14.26)。这清晰地反映了金融收益普遍存在的“尖峰厚尾”非正态分布特征。该特征意味着,与正态分布的预测相比,极端事件(无论是正向还是负向的大幅波动)在现实中发生的频率要高得多,这对于风险管理具有极其重要的警示意义。
4.2 RCMSE分析 (RCMSE Analysis)
我们对四种资产的对数收益率进行了RCMSE分析。总体趋势是,所有资产的熵值都随着时间尺度的增加而下降。然而,对比分析揭示了比特币的独特性:
* 在小尺度上,比特币的熵值最低,表明其在短期内表现出更强的规律性和可预测性。
* 在大尺度上,比特币的熵值反超其他资产,成为最高者,这说明其在长期视角下更不稳定、更复杂。
* 与之相对,英镑/美元在小尺度上熵值最高,显示出最高的短期不可预测性。
为了对跨尺度的复杂性进行综合度量,我们计算了所有尺度上熵值的总和,即“总复杂性”,结果如下表所示。
指标 比特币 英镑/美元 黄金 天然气
初始尺度熵 (Entropy at scale 1) 1.25 2.25 1.75 2.00
总复杂性 (Complexity) 74.66 67.24 67.88 51.48
分析表明,比特币的总复杂性(74.66)在四种资产中位列第一,而天然气的总复杂性最低。这证实了比特币的动态结构在多个时间尺度上平均而言最为复杂。这一发现意味着,针对比特币的交易策略和风险模型必须能够适应其在不同时间尺度上动态切换的行为模式——从短期的规律性到长期的混沌性。
为了探究序列复杂性的来源,我们进行了数据随机打乱实验。结果显示,比特币的熵值在数据被打乱后显著增加,而其他三种资产的熵值在打乱前后变化不明显。这一发现是比特币序列中存在非线性相关性的有力证据。随机打乱破坏了序列内在的时间结构,导致其规律性降低、熵值增加。其他资产变化不显著,则表明它们的动态行为更接近于随机过程。
4.3 MF-DFA分析 (MF-DFA Analysis)
MF-DFA分析的核心在于奇异谱,其宽度(Δα)是衡量时间序列多重分形强度和复杂性的关键指标。谱宽越大,表明序列的动力学结构越丰富,复杂性越高。值得注意的是,比特币谱系中包含的较大α值(αmax = 1.04)不仅证实了其价格序列中存在更多平滑变化的行为片段,更与RCMSE分析中其在小尺度上熵值最低的发现形成了完美的逻辑闭环。这两种独立的方法共同指向一个结论:比特币的短期行为具有显著的规律性,这可能为高频交易策略提供了潜在机会。
下表展示了四种资产的奇异谱参数。
指标 比特币 英镑/美元 黄金 天然气
谱宽 (Spectrum Width, Δα) 0.62 0.50 0.44 0.21
αmax 1.04 0.67 0.64 0.60
αmin 0.43 0.17 0.19 0.39
从表中可以清晰地看到,比特币的谱宽(0.62)远大于其他资产,这证明了其具有最强的多重分形特性和最高层次的复杂性。
我们同样对随机打乱后的数据进行了MF-DFA分析。结果显示,所有资产的奇异谱宽度在打乱后均显著减小。这一现象有力地证明了原始序列中所观察到的多重分形特性,源于其真实的内在结构(如非线性相关性),而并非由随机噪声或分布的厚尾特性简单导致。最后,我们计算了赫斯特指数,该指数用于衡量序列的线性自相关性。
指标 比特币 英镑/美元 黄金 天然气
赫斯特指数 (Hurst Exponent) 0.51 0.49 0.48 0.50
所有资产的赫斯特指数均约等于0.5。这表明资产的对数收益率序列中几乎不存在线性自相关性,即过去的收益对未来的收益没有线性的预测能力。然而,结合前述RCMSE和MF-DFA的打乱实验结果,这一发现恰恰强化了非线性相关性在驱动市场动态中扮演关键角色的结论。
综合来看,赫斯特指数(H≈0.5)排除了线性记忆,而RCMSE和MF-DFA的随机打乱实验则共同揭示了复杂性的真实来源。熵值的显著增加和谱宽的大幅缩减是同一现象的两个侧面:破坏时间序列的内在非线性结构会使其行为退化为简单的随机性。这雄辩地证明,比特币等资产的复杂动态是一种需要用非线性动力学框架来理解的确定性结构,而非纯粹的随机游走。
实证结果已充分展示,下一章将对所有发现进行总结和讨论,提炼出核心结论。
5. 结论 (结论)
本章将对前述所有分析进行系统性概括,并提炼出本研究的核心结论。通过结合使用改进复合多尺度样本熵(RCMSE)和多重分形去趋势波动分析(MF-DFA),我们对四种代表性金融资产的复杂性进行了深入的比较研究。
本研究的核心发现可总结如下:
* 波动性特征:尽管比特币和天然气的对数收益率序列表现出相似的高波动性,但两种资产在不同时间尺度上展现出截然不同的复杂性特征,这表明仅靠波动率不足以全面评估市场风险。
* 基于熵的复杂性分析:比特币展现出一种独特的复杂性模式:在短时间尺度上,其规律性最强(熵值最低),表现出较高的可预测性;但在长时间尺度上,其不稳定性显著增加,熵值最高。综合来看,其跨所有尺度的总复杂性在所有被分析的资产中位居榜首。
* 多重分形特性:MF-DFA分析结果确认了比特币的最高复杂性。其拥有最宽的奇异谱,这表明比特币的时间序列具有最强的多重分形性质和最丰富的动力学结构,涵盖了从剧烈波动到平稳变化的多种行为模式。
* 非线性相关性的证据:尽管所有资产的赫斯特指数均接近0.5,表明缺乏线性自相关性,但随机打乱实验提供了关键证据。比特币序列在打乱后,其熵值显著增加且奇异谱宽度大幅减小,这有力地证明了其复杂的动态行为主要是由深层的非线性相关性驱动的,而非简单的随机过程。
综上所述,本研究揭示了金融时间序列(尤其是以比特币为代表的加密货币)可以在不同时间尺度上表现出混合且深刻的复杂动态。比特币在短期内呈现规律性,而在长期内则展现出高度不稳定的多重分形结构,这种复杂的行为模式是由其内在的非线性相关性所主导的。这些发现深刻地反映了金融系统作为复杂适应性系统的本质——其动态并非源于单一的随机过程,而是由市场力量、投资者行为与宏观事件在多个尺度上交织而成的、具有内在结构的确定性混沌。




