基于多智能体遗传算法的加密货币交易策略优化

基于多智能体遗传算法的加密货币交易策略优化

Qiushi Tian, Churong Liang, Kairan Hong, Runnan Li* 北京邮电大学,中国北京 *通讯作者

--------------------------------------------------------------------------------

摘要 (Abstract) 加密货币市场因其极端波动性、非平稳动态和复杂的微观结构模式,给传统参数优化方法带来了巨大挑战。本文提出了一种名为“加密货币遗传算法智能体”(CGA-Agent)的创新性混合框架,该框架协同整合了遗传算法与智能多智能体协调机制,旨在动态金融环境中实现自适应的交易策略参数优化。该框架的独特之处在于,它通过智能机制将实时市场微观结构情报和自适应策略性能反馈动态地融入进化过程,从而超越了静态优化的局限性。在三种主流加密货币上进行的全面实证评估结果表明,该框架在总回报和风险调整后指标方面均取得了系统性且统计上显著的性能提升。

关键词 (Index Terms) 加密货币交易策略, 多智能体系统, 遗传算法, 自动化参数优化

--------------------------------------------------------------------------------

1. 引言 (引言)

在现代金融市场中,量化交易已成为一种主导范式,它利用算法决策系统,基于复杂的数学模型和统计推断来执行交易。这种转型在加密货币市场中尤为显著,该市场以其独特的特性而闻名,包括极端的价格波动 [1]、显著的尾部风险 [3]、复杂的羊群行为 [4] 和明显的下行风险 [2]。这些特性使得传统的策略优化方法难以获得持续的盈利能力。

交易策略的参数优化是量化金融领域的一项根本性挑战。尽管遗传算法(GAs)等演化算法凭借其全局搜索能力、对多模态目标函数的稳健处理以及无梯度优化的特性,在金融优化领域展现了卓越的效果 [5, 6, 7],但传统的实现方式仍存在根本性局限。具体而言,传统遗传算法在静态参数空间和固定适应度函数下运行,这从根本上限制了它们适应快速变化的市场条件的能力。最关键的是,现有方法未能将实时市场情报和策略性能反馈整合到优化过程中,导致参数配置在市场机制转变时迅速失效。

为了应对这些挑战,我们引入了 CGA-Agent,一个新颖的混合框架。该框架旨在解决上述问题,其核心创新在于将多智能体协调机制与遗传算法相结合,通过智能体之间的协同工作,实现了基于实时市场情报和性能反馈的动态、自适应优化过程。这使得策略能够超越静态优化的局限,动态适应不断变化的市场环境。

本文的主要贡献可总结如下:

1. 算法创新 (Algorithmic Innovation): 本框架将多智能体协调机制直接整合到遗传算法的操作中,与传统的中心化方法相比,实现了更复杂的演化动态和更优的收敛特性。
2. 自适应智能优化 (Adaptive Intelligence Optimization): 本框架动态地融合了策略性能指标和实时市场信息,以指导进化过程,实现了无需人工干预即可适应变化市场机制的上下文感知策略优化。
3. 性能提升 (Performance Improvement): 通过在三种主要加密货币(BTC, ETH, BNB)上的全面实验,证明了该框架在总回报和关键风险调整指标上均取得了系统性的显著性能提升。

本节的讨论为理解CGA-Agent框架的动机和设计奠定了基础,下一章节将回顾相关领域的研究工作。

2. 相关工作 (Related Work)

本章节旨在回顾演化算法和多智能体系统在金融领域的应用,为深入理解CGA-Agent框架的创新性和研究背景提供坚实的理论基础。

2.1. 金融优化中的演化算法 (Evolutionary Algorithms in Financial Optimization)

遗传算法(GAs)已成为金融参数优化的基础工具,尤其是在处理复杂、非线性和多模态搜索空间方面表现出色。早期的开创性工作主要集中在技术指标的参数调整上 [5, 6],而近期的研究进展已将遗传算法的应用扩展到更复杂的领域,如投资组合优化、多目标风险管理和动态交易策略开发 [7]。

加密货币交易领域为演化优化提供了极具吸引力的应用场景,其独特的市场特性对传统优化方法构成了严峻挑战。市场的极端波动 [1]、显著的非平稳动态 [2] 以及复杂的尾部风险行为 [3] 共同创造了一个优化环境,在这样的环境中,传统的基于梯度或启发式的方法常常会收敛到次优解。此外,加密货币市场特有的羊群行为和情绪驱动动态 [4] 引入了时间依赖性,这要求优化策略必须具备自适应能力,而遗传算法恰好能满足这一需求。

2.2. 量化金融中的多智能体系统 (Multi-Agent Systems in Quantitative Finance)

多智能体系统(MAS)作为一种变革性范式,正在应对金融决策的复杂性和分布式特性方面崛起。早期的基础工作主要集中在市场模拟和交易者行为建模 [8],而近期的实证研究已证明,MAS框架在复杂的金融场景中,尤其是在需要协调决策和处理信息不对称的环境下,具有系统性的性能优势 [9, 10]。

MAS的优势在多个方面得以体现。例如,在市场模拟中,MAS能够产生更稳健的回测结果,更好地捕捉真实世界的市场动态 [15]。当代的交易系统通过采用MAS架构,利用协作分析和分布式决策来提升整体性能 [13, 14, 12]。近期的进展,如FLAG-TRADER [14] 展示了如何通过强化学习来增强智能体的决策能力,而GA-LLM [18] 则通过展示大型语言模型如何以语义引导的方式智能地增强交叉和变异等遗传算子,为智能优化过程建立了重要先例。然而,当前研究中存在一个明显的空白:虽然MAS已被广泛应用于交易执行,但将其原理系统性地应用于参数优化过程,是一个未被充分探索且具有重大理论与实践意义的研究方向。

本文提出的CGA-Agent框架正是为了填补这一空白,将多智能体协作的优势引入到遗传算法的参数优化循环中。

3. 方法论 (Methodology)

本章节将详细阐述CGA-Agent框架,这是一个将遗传算法与多智能体协调机制相融合的新型混合优化系统。我们将从问题定义、整体架构和各智能体工作机制三个层面进行分解,以全面揭示该系统的工作原理。

3.1. 问题定义 (Problem Formulation)

我们考虑一个参数化的交易策略 S(θ),其中 θ ∈ Θ ⊂ Rd 代表一个d维的策略参数向量,而 Θ 是受实际交易限制的可行参数空间。我们的目标是找到最优的参数配置 θ*,以最大化适应度函数。然而,由于加密货币市场的动态性,随着新数据的出现,必须通过周期性的再优化来进行持续适应。因此,优化问题定义如下:

$$ θ^*{t+∆t} = \underset{θ∈Θ}{\text{argmax}} \ F(S(θ), D{t:∆t}) \quad (1) $$

在此公式中,F(·) 是适应度函数,θ* t+∆t 是在时间 t+∆t 时的最优策略参数配置。Dt:∆t 代表一个大小为 ∆t 的滚动窗口内的近期市场数据。这种设计使框架能够适应不断变化的市场机制,同时保持性能评估的统计显著性。

适应度函数的定义如下:

$$ F(S(θ), D) = \sum_{j=1}^{11} w_j \cdot \phi_j(S(θ), D) \quad (2) $$

其中,ϕj(·) 是计算单个指标(如夏普比率、索提诺比率等)分数的函数,而 wj 代表每个指标的权重。

3.2. CGA-Agent架构 (CGA-Agent Architecture)

CGA-Agent框架采用一个由多个专业化智能体组成的精密协调的多智能体系统,每个智能体都专注于策略参数优化过程中的特定环节。

该架构由六个专业智能体组成:分析智能体 (Aanal)、生成智能体 (Agen)、评估智能体 (Aeval)、选择智能体 (Acho)、交叉智能体 (Across) 和 变异智能体 (Amut)。其中,分析智能体(Aanal)和生成智能体(Agen)负责初始参数基因的生成,而其他四个智能体则在一个循环中持续优化参数,直到满足终止条件并返回最优参数。这个协同工作流程确保了优化过程既高效又具有适应性。

3.3. CGA-Agent机制 (CGA-Agent Mechanisms)

* 分析智能体 (Aanal) 和 生成智能体 (Agen) 这两个智能体协同工作,负责为整个框架生成初始的策略参数基因。Aanal 根据策略信息和市场数据确定每个参数的优化方向,而 Agen 则依据这些方向和参数的默认值来创建初始的策略参数基因。
* 评估智能体 (Aeval) Aeval 接收所有最新的策略参数基因,并自动执行策略回测,以获取在这些参数下策略的11个回测结果,包括夏普比率、年化回报率、胜率和回报波动率等。随后,它使用预定义的评分模板和公式(2)为所有参数基因计算适应度分数,并根据所有基因的适应度分数实时更新全局最优参数。
* 选择智能体 (Acho) 该智能体采用精英主义与加权轮盘赌选择相结合的混合策略。适应度排名前20%的基因被直接保留,构成精英池。其余基因则根据公式(3)和(4)计算出的选择概率进行随机采样,直至基因列表达到预设规模。每个基因 gj 的选择权重 wj 和概率 P(gj) 的计算方式如下:
* $$ w_j = s_j - s_{min} + 1 \quad (3) $$
* $$ P(g_j) = \frac{w_j}{\sum_{i=1}^{k} w_i} \quad (4) $$
* 其中,sj 是基因 gj 的适应度分数,smin 是所有适应度分数中的最小值。最后,框架会根据预设的最大基因数量对列表进行筛选,以确保总体数量的一致性。
* 交叉智能体 (Across) Across 自动遍历精英基因列表中的策略参数基因,并基于量化市场的先验知识和预定义的交叉模板执行交叉操作,以生成新一代的基因。此过程确保新生成的基因数量与框架预设的最大值保持一致。
* 变异智能体 (Amut) Amut 根据框架预设的比例,从新一代策略参数基因中进行采样。它会分析当前最优参数的特征,并基于预定义的模板执行有针对性的变异操作,最终生成用于下一轮迭代的最终新一代策略参数基因。

通过这些智能体的协同工作,CGA-Agent框架得以实现动态且智能的参数优化。

4. 实验评估 (Experimental Evaluation)

本章节旨在通过在多个加密货币市场上的系统性实验,对CGA-Agent框架的性能进行实证评估。我们将一个集成了CGA-Agent的策略(CGA-Agent-SS)与一个基准策略(SS)进行对比,以量化其性能提升效果。

4.1. 基准策略 (Baseline Strategy)

我们采用一种“剥头皮策略”(Scalping Strategy, SS)作为基准,它通过快速和慢速相对强弱指数(RSI)的交叉来生成交易信号,提供了一个现实且具有挑战性的优化场景。该策略的信号生成机制如下:

* 买入信号: 快速RSI上穿慢速RSI
* 卖出信号: 快速RSI下穿慢速RSI

该策略包含三个可配置的交易信号过滤开关,旨在适应不同的市场条件:

* 快速移动平均过滤器 (FMAF): 用于确认短期趋势。
* 慢速移动平均过滤器 (SMAF): 用于确认长期趋势。
* 斜率过滤器 (SF): 通过平均真实波幅(ATR)归一化来衡量趋势强度。

4.2. 数据集与设置 (Dataset and Setup)

实验使用了三种具有代表性且被广泛采用的加密货币:比特币 (BTC)、以太坊 (ETH) 和币安币 (BNB)。我们采用这三种货币从2024年12月25日到2025年9月1日(共252天)的5分钟K线数据作为历史回测数据。

为了确保评估的严谨性,我们采用了严格的滚动窗口回测框架,并每30个交易日进行一次动态参数再优化。这种设置既保持了时间上的一致性,又使策略能够适应不断变化和波动的市场条件。

4.3. 综合结果分析 (Comprehensive Results Analysis)

趋势分析 从总资产的变化趋势来看,在第30天CGA-Agent完成首次优化后,所有三个加密货币场景的总资产都发生了显著变化,这表明CGA-Agent能够有效调整策略方向。在第60天之后,总资产的波动性开始增加,这表明更高的交易频率带来了更高的回报,同时也伴随着更高的风险。在整个回测期结束时,所有经过CGA-Agent优化的策略场景最终都优于基准策略。

参数调整案例分析 (ETH) 为了评估参数变化的影响,我们收集了ETH场景在第60天的参数调整结果。如下表所示,参数的调整(例如,RSI长度的微调以及移动平均过滤器的开关切换)直接影响了策略行为。这些调整使得CGA-Agent-SS策略在ETH场景中的总资产持续增长,并在大部分时间内保持在基准策略之上。

参数 旧值 新值
RSI1 长度 28 25
RSI2 长度 6 7
SMAF False True
SF True False

量化性能评估 我们收集了基准策略(SS)和CGA-Agent-SS在三种加密货币上的综合回测结果,涵盖了五个关键指标:总盈亏 (PnL)、回报波动率、夏普比率、索提诺比率和风险回报比。详细数据如下表所示。

资产 策略 总盈亏 (PnL) 回报波动率 夏普比率 索提诺比率 风险回报比
BTC SS (基准) 1.68% 0.12 1.36 2.81 0.035
CGA-Agent-SS (本文) 2.17% 0.17 1.26 2.51 0.025
ETH SS (基准) 0.64% 0.14 0.46 0.80 0.013
CGA-Agent-SS (本文) 4.16% 0.20 2.09 4.11 0.031
BNB SS (基准) 3.44% 0.25 1.35 2.61 0.044
CGA-Agent-SS (本文) 9.27% 0.30 2.99 6.55 0.054

从量化结果来看,CGA-Agent框架的有效性得到了充分证明。

* 在 BTC 场景中,CGA-Agent以牺牲部分风险调整后收益(夏普比率下降7.35%,索提诺比率下降10.68%)为代价,实现了总盈亏 29.17% 的显著增长,同时风险回报比下降了 28.57%,表明其在风险控制方面仍具一定优势。
* 对于 ETH,尽管回报波动率增加了42.86%,但盈亏大幅增长了 550%,夏普比率和索提诺比率分别飙升了 354.35% 和 413.75%,显示出显著的性能改善。
* 对于 BNB,盈亏增加了 169.48%,夏普比率和索提诺比率分别攀升了 121.48% 和 150.96%,而回报波动率仅比基准策略略微上升了20%。

这些实验结果有力地证实了CGA-Agent在提升策略盈利能力和风险调整后回报方面的系统性优势。

5. 结论 (结论)

本文引入了一个名为CGA-Agent的新型混合框架,该框架通过将传统遗传算法与多智能体协调机制相结合,在动态的加密货币交易市场中实现了智能化的参数优化。该框架的核心创新在于,它能够动态地适应变化的市场微观结构,从而持续保持优异的整体性能,这一点已在三种主要加密货币的实验中得到证实。

这些研究结果将CGA-Agent定位为向量化金融领域迈向更智能、更自适应优化系统的根本性进步。它为在日益复杂和动荡的市场中开发新一代交易策略建立了坚实的理论和实践价值。

6. 参考文献 (References)

[1] D. G. Baur and T. Dimpfl, “Asymmetric volatility in cryptocurrencies,” Economics Letters, vol. 173, pp. 148–151, 2018. [Online]. Available: https://www.sciencedirect.com/science/article/pii/ S016517651830421X

[2] V. Dobrynskaya, “Is downside risk priced in cryp-tocurrency market?” International Review of Financial Analysis, vol. 91, p. 102947, 2024. [Online]. Available: https://www.sciencedirect.com/science/article/pii/ S1057521923004635

[3] D. F. Ahelegbey, P. Giudici, and F. Mojtahedi, “Tail risk measurement in crypto-asset markets,” International Review of Financial Analysis, vol. 73, p. 101604, 2021. [Online]. Available: https://www.sciencedirect. com/science/article/pii/S1057521920302477

[4] E. Bouri, R. Gupta, and D. Roubaud, “Herding behaviour in cryptocurrencies,” Finance Research Letters, vol. 29, pp. 216–221, 2019. [Online]. Available: https://www.sciencedirect.com/science/article/pii/ S1544612318303647

[5] F. Allen and R. Karjalainen, “Using genetic algorithms to find technical trading rules,” Journal of Financial Economics, vol. 51, no. 2, pp. 245–271, 1999. [Online]. Available: https://www.sciencedirect.com/ science/article/pii/S0304405X9800052X

[6] Q. Yang, “Blending ensemble for classifica-tion with genetic-algorithm generated alpha factors and sentiments (gas),” 2024. [Online]. Available: https://arxiv.org/abs/2411.03035

[7] J.-H. Syu, M.-E. Wu, C.-H. Chen, and J.-M. Ho, “Threshold-adjusted orb strategies with genetic algo-rithm and protective closing strategy on taiwan futures market,” in ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 1778–1782.

[8] A. Dorri, S. S. Kanhere, and R. Jurdak, “Multi-agent systems: A survey,” IEEE Access, vol. 6, pp. 28 573– 28 593, 2018.

[9] T. Guo, X. Chen, Y. Wang, and et al., “Large language model based multi-agents: A survey of progress and challenges,” in Proceedings of the Thirty-Third In-ternational Joint Conference on Artificial Intelligence, IJCAI-24, K. Larson, Ed. International Joint Confer-ences on Artificial Intelligence Organization, 8 2024, pp. 8048–8057, survey Track. [Online]. Available: https://doi.org/10.24963/ijcai.2024/890

[10] X. Li, S. Wang, S. Zeng, Y. Wu, and Y. Yang, “A survey on llm-based multi-agent systems: workflow, infrastructure, and challenges,” Vicinagearth, vol. 1, no. 1, Oct. 2024. [Online]. Available: https://doi.org/10. 1007/s44336-024-00009-2

[11] Y. Yu, Z. Yao, H. Li, Z. Deng, and et al., “Fincon: A synthesized llm multi-agent system with conceptual verbal reinforcement for enhanced financial decision making,” in Advances in Neural Information Processing Systems, A. Globerson, L. Mackey, D. Belgrave, A. Fan, U. Paquet, J. Tomczak, and C. Zhang, Eds., vol. 37. Curran Associates, Inc., 2024, pp. 137 010–137 045. [Online]. Available: https: //proceedings.neurips.cc/paper files/paper/2024/file/ f7ae4fe91d96f50abc2211f09b6a7e49-Paper-Conference. pdf

[12] H. Zhang, Z. Shi, Y. Hu, W. Ding, and et al., “Opti-mizing trading strategies in quantitative markets using multi-agent reinforcement learning,” in ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024, pp. 136– 140.

[13] Y. Li, B. Luo, Q. Wang, N. Chen, X. Liu, and B. He, “CryptoTrade: A reflective LLM-based agent to guide zero-shot cryptocurrency trading,” in Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, Y. Al-Onaizan, M. Bansal, and Y.-N. Chen, Eds. Miami, Florida, USA: Association for Computational Linguistics, Nov. 2024, pp. 1094– 1106. [Online]. Available: https://aclanthology.org/ 2024.emnlp-main.63/

[14] G. Xiong, Z. Deng, K. Wang, Y. Cao, H. Li, Y. Yu, X. Peng, M. Lin, K. E. Smith, X.-Y. Liu, J. Huang, S. Ananiadou, and Q. Xie, “Flag-trader: Fusion llm-agent with gradient-based reinforcement learning for financial trading,” 2025. [Online]. Available: https://arxiv.org/abs/2502.11433

[15] M. Karpe, J. Fang, Z. Ma, and C. Wang, “Multi-agent reinforcement learning in a realistic limit order book market simulation,” in Proceedings of the First ACM International Conference on AI in Finance, ser. ICAIF ’20. New York, NY, USA: Association for Computing Machinery, 2021. [Online]. Available: https://doi.org/10.1145/3383455.3422570

[16] L.-C. Cheng and J.-S. Sun, “Multiagent-based deep reinforcement learning framework for multi-asset adap-tive trading and portfolio management,” Neurocom-puting, vol. 594, p. 127800, 2024. [Online]. Available: https://www.sciencedirect.com/science/article/pii/ S092523122400571X

[17] Y. Xiao, E. Sun, D. Luo, and W. Wang, “Tradingagents: Multi-agents llm financial trading framework,” 2025. [Online]. Available: https://arxiv.org/abs/2412.20138

[18] W. Shum, R. Chan, J. Lin, B. Feng, and P. Lau, “A hy-brid GA LLM framework for structured task optimiza-tion,” arXiv preprint arXiv:2506.07483, 2025.

[19] F. Aslam, B. A. Memon, A. I. Hunjra, and E. Bouri, “The dynamics of market efficiency of major cryptocur-rencies,” Global Finance Journal, vol. 58, p. 100899, 2023. [Online]. Available: https://www.sciencedirect. com/science/article/pii/S1044028323000947

[20] F. Allen, X. Gu, and J. Jagtiani, “Fintech, cryptocur-rencies, and cbdc: Financial structural transformation in china,” Journal of International Money and Fi-nance, vol. 124, p. 102625, 2022. [Online]. Avail-able: https://www.sciencedirect.com/science/article/pii/ S0261560622000286

[21] J. Almeida and T. C. Gonçalves, “Cryptocurrency market microstructure: a systematic literature review,” Annals of Operations Research, vol. 332, no. 1–3, p. 1035–1068, Oct. 2023. [Online]. Available: https: //doi.org/10.1007/s10479-023-05627-5

[22] P. Kolbadi and H. Ahmadinia, “Examining sharp, sortino and sterling ratios in portfolio management, evi-dence from tehran stock exchange,” International Jour-nal of Business and Management, vol. 6, no. 4, p. 222, 2011.