QuantAgent:基于价格驱动的多智能体大语言模型用于高频交易
Fei Xiong¹˒²˒†, Xiang Zhang³˒†, Aosong Feng⁴, Siqi Sun⁵, Chenyu You¹
¹ 纽约州立大学石溪分校 (Stony Brook University)
² 卡内基梅隆大学 (Carnegie Mellon University)
³ 不列颠哥伦比亚大学 (University of British Columbia)
⁴ 耶鲁大学 (Yale University)
⁵ 复旦大学 (Fudan University)
† 等同贡献
通讯作者: chenyu.you@stonybrook.edu, siqisun@fudan.edu.cn
--------------------------------------------------------------------------------
摘要 (Abstract)
近年来,大语言模型(LLM)在金融推理和市场理解方面展现出令人瞩目的能力。尽管如 TradingAgent 和 FINMEM 等多智能体 LLM 框架已将这些模型应用于长周期投资任务,但它们依赖于基本面和情绪等文本输入,难以满足高频交易(HFT)对速度和精度的严苛要求。为解决这一问题,我们引入了 QuantAgent,这是首个专为高频算法交易设计的多智能体 LLM 框架。该系统完全依赖于价格数据(OHLC),将交易任务分解给五个专业智能体:IndicatorAgent(指标分析)、PatternAgent(模式识别)、TrendAgent(趋势判断)、RiskAgent(风险控制)和 DecisionAgent(决策执行),它们协同工作以捕捉短时间窗口内的市场动态。在覆盖比特币和纳斯达克期货等八种金融工具的零样本(zero-shot)评估中,QuantAgent 在 4 小时交易区间内的预测准确性和累计回报率均显著优于强大的神经网络和规则基准模型。我们的研究表明,将结构化的金融先验知识与语言模型的原生推理能力相结合,为高频金融市场中构建可追溯的实时决策系统开辟了新的潜力。
--------------------------------------------------------------------------------
1. 引言 (引言)
“建立声誉需要 20 年,而毁掉它只需要 5 分钟。”
—— 沃伦·巴菲特
高频交易(HFT)对决策的速度和精度有着极高的要求。在这样的环境中,风险控制至关重要,正如沃伦·巴菲特的名言所警示的那样。技术分析的核心思想在于,历史价格数据是市场状况最直接、信息密度最高的反映。该理论认为,价格的波动已经内含了公司基本面、宏观经济事件、机构资金流向和集体市场情绪等所有关键信息。每个交易周期,无论是一分钟、一小时还是一天,都可以通过四个关键值来概括:开盘价、最高价、最低价和收盘价(OHLC)。这种通用表示方法使得分析师能够在股票、大宗商品和加密货币等不同资产上应用成熟的算法和启发式方法,以识别趋势、反转、突破和动量变化。根据有效市场假说,资产价格会迅速吸收所有公开信息,这使得 OHLC 数据中的模式和趋势成为短时预测的充分依据,无需依赖外部的文本或新闻输入。
与此同时,大语言模型(LLM)在多步推理、工具使用、代码生成和可解释性方面取得了显著进展,这使其成为量化金融领域的有力候选者。然而,迄今为止,大多数基于 LLM 的金融系统严重依赖新闻、社交媒体或财报等文本输入。这种设计存在两个主要局限性:(1) 文本信号通常滞后于市场变化;(2) 文本数据充满噪音、非结构化且可靠性低。鉴于价格本身已为短时交易提供了充足信息,将 LLM 的推理能力直接与结构化的价格信号相结合,无疑是一个极具吸引力的方向。然而,据我们所知,目前尚无系统探索直接利用 LLM 处理结构化的 OHLC 数据进行高频交易。
为此,我们提出了 QuantAgent,这是首个专为高频算法交易量身定制的多智能体 LLM 框架。QuantAgent 将交易任务分解给五个协同工作的专业智能体:IndicatorAgent、PatternAgent、TrendAgent、RiskAgent 和 DecisionAgent,每个智能体都旨在捕捉技术分析的一个互补维度。IndicatorAgent 将原始 OHLC 输入浓缩为稳健的技术指标,提供抗噪音的市场摘要;PatternAgent 借助 LLM 的多模态推理能力识别几何形态;TrendAgent 评估多时间跨度下的方向动量;RiskAgent 则将所有信号综合成一个平衡的风险回报框架;最终由 DecisionAgent 整合所有观点,做出可解释的交易决策。
我们在一个涵盖大宗商品(原油、黄金)、股票指数(标普500、QQQ)和加密货币(比特币)的多元化基准上对 QuantAgent 进行了评估。在 4 小时交易分辨率的零样本(zero-shot)设置下,我们的系统表现持续优于传统的规则和神经网络基准模型,并在股票市场取得了尤为显著的优势。更重要的是,QuantAgent 能够生成可追溯的、基于自然语言的决策解释,提供了传统算法交易流程所缺乏的透明度。此外,我们还开发了一个本地化的、基于浏览器的界面,使用户能够选择资产、可视化市场动态,并与 LLM 生成的分析进行交互,进一步强调了项目的透明度和可解释性。接下来,我们将回顾与本研究相关的背景工作。
2. 相关工作 (Related Works)
本节将回顾两个与 QuantAgent 设计密切相关的研究领域:用于金融决策的基于智能体的 LLM 和传统的量化交易技术。通过梳理现有研究,我们将阐明 QuantAgent 的创新之处及其理论基础。
2.1 用于金融决策的基于智能体的 LLM (Agent-Based LLMs for Financial Decision-Making)
QuantAgent 的设计借鉴了当前迅速发展的基于智能体的金融 LLM 研究。例如,FINMEM 通过为交易智能体增加分层的工作记忆和长期记忆,使其能够整合从宏观指标到公司财报的异构时间信号。类似地,FINCON 引入了一个采用口头强化学习训练的管理-分析师层级结构,让特定角色的智能体跨资产类别协同推理。这两个框架都主要面向长周期预测和信息丰富的策略,这与 QuantAgent 专注于价格驱动的高频交易场景形成鲜明对比。
另一个相关系统是 TradingAgents,它模拟了机构交易台的协作流程。在该框架中,技术分析师、新闻分析师、风险经理和投资组合交易员等不同智能体通过结构化信息进行沟通,共同制定交易决策。尽管 TradingAgents 整合了市场数据和新闻等文本信号,但其主要设计目标是在信息快速流动的环境中提升决策的可解释性,而非实现高频交易所要求的微秒级执行和纯粹的价格驱动推理。
2.2 基于指标和模式的量化交易 (Quantitative Trading Based on Indicators and Patterns)
在 LLM 智能体出现之前,量化交易系统主要依赖结构化的数值指标(如趋势、波动率和动量)来指导日内决策。早期的研究表明,某些非线性价格模式在短周期内具有统计上显著的预测能力。然而,这些方法也存在局限性,例如过度依赖单步预测的准确性以及容易受到研究者偏见的影响,这促使研究人员开发更稳健的模式匹配技术。
动量策略是研究最广泛的方法之一,它利用了过去赢家和输家倾向于延续其走势的经验性规律。除了线性指标,如图表模式库等框架试图捕捉原始 K 线序列中的高阶几何规律。近年来,机器学习技术的发展使得自动检测这些形态成为可能,其识别性能已能与人类专家相媲美。尽管这些方法具有可解释性和计算效率,但在市场剧烈波动或充满噪音时性能常常会下降。
QuantAgent 正是建立在这些工作的基础之上,通过将结构化的技术信号与 LLM 的自适应推理能力相结合,提升了系统在动态高频市场中的鲁棒性和适应性。
在回顾了现有研究后,下文将详细介绍 QuantAgent 的系统架构。
3. QuantAgent 系统架构 (QuantAgent System Architecture)
为了弥合传统高频量化交易与新兴多智能体 LLM 系统之间的差距,我们引入了 QuantAgent,一个旨在实现模块化和可解释金融智能的协作框架。该框架将经典技术分析与结构化的 LLM 推理相结合,并完全基于价格衍生信号进行决策。这一设计旨在规避外部文本数据带来的延迟和噪音,使其更适用于高频交易环境。
系统的整体工作流程模拟了机构交易台的模式,将复杂的交易任务分解给四个专业智能体(IndicatorAgent、PatternAgent、TrendAgent、RiskAgent)和一个决策智能体(DecisionAgent)。这些智能体通过结构化提示进行通信,从不同维度协同分析市场动态,最终形成统一的交易决策。
3.1 IndicatorAgent 设计
IndicatorAgent 是框架的初始分析模块,其核心职责是将原始的 OHLC 价格序列转换为结构化的量化信号。在高频交易中,技术指标提供了一种简洁的表示方法,能够有效揭示市场动量和情绪的变化。通过将低级价格数据抽象为高级特征,IndicatorAgent 为下游智能体提供了抗噪音的市场动态摘要,从而支持快速且可解释的推理。
该智能体使用了一组广泛应用的五个关键技术指标,以从市场数据中提取可操作的信号:
* 相对强弱指数 (RSI): 衡量市场动量,用于识别超买或超卖状态,预示潜在的价格反转。
* 平滑异同移动平均线 (MACD): 追踪短期和长期价格趋势的聚合与分离,揭示动量的转换。
* 变动率 (RoC): 显示价格变动的速度,帮助发现速度或方向的变化。
* 随机指标 (STOCH): 通过比较当前价格与近期高低点的位置,识别潜在的市场转折点。
* 威廉姆斯 %R (WILLR): 衡量当前收盘价与近期高点的距离,帮助识别市场可能下跌或准备反转的时机。
其中,MACD 因其在趋势跟踪方面的优势而具有代表性。它通过分析两条指数移动平均线(EMA)之间的差异来指示动量变化。其计算公式如下: E_t = \alpha \cdot P_t + (1-\alpha) \cdot E_{t-1} M_t = E^{(f)}_t - E^{(s)}_t S_t = \text{EMA}_9(M_t)
在这里,E_t 是指数移动平均线,P_t 是当前价格,E_{t-1} 是前一期的 EMA 值。平滑因子 \alpha 根据周期数 N 计算得出:\alpha = 2 / (N+1)。在我们的系统中,快速 EMA (E^{(f)}_t) 使用 N = 12 的周期,慢速 EMA (E^{(s)}_t) 使用 N = 26 的周期。动量信号 M_t 是这两条 EMA 的差值。信号线 S_t 则是对动量信号 M_t 序列本身计算的 9 周期 EMA。当 M_t 向上穿越 S_t 时,产生看涨信号;反之,则为看跌信号。这种设计使 MACD 能有效捕捉中期趋势变化,同时过滤掉高频价格噪音。
3.2 PatternAgent 设计
尽管数值指标很有用,但在某些市场条件下(如价格盘整)可能会变得模糊不清。为了解决这一局限性,PatternAgent 引入了一种视觉和结构化的多模态推理视角。
PatternAgent 首先利用工具将原始价格数据生成清晰的 K 线图。接着,它会自动检测图中的关键视觉特征,如重要的高点和低点。然后,PatternAgent 将当前的市场结构与一个用自然语言描述的模式库进行比对,以识别最匹配的模式,例如“V 形反转”。通过这种方式,该智能体能够将复杂的视觉信号转化为简洁、可解释的摘要,从而将图表结构融入整体的市场理解中,揭示那些常常预示重大价格变动的形态。
3.3 TrendAgent 设计
图表模式的意义只有在明确的趋势背景下才能完全体现。TrendAgent 的战略重要性在于,通过跟踪价格动向的方向和斜率,为检测到的模式提供趋势背景。这有助于判断一个模式是预示着趋势的延续、反转还是盘整。
在技术实现上,TrendAgent 使用普通最小二乘法(OLS)对近期的局部高点和低点进行拟合,分别生成阻力线和支撑线。通过计算这两条线的平均斜率 κt,系统可以估计价格通道的方向漂移。
算法 1: 基于斜率感知的趋势检测
输入: 价格序列 P0:T-1, 窗口大小 N, 斜率阈值 τ
1 for t = N-1 to T-1 do
2 对高点/低点拟合 OLS,得到斜率 mr, ms;
3 κt ← (mr + ms) / 2;
4 if κt > τ then Trend ← Uptrend;
5 else if κt < -τ then Trend ← Downtrend;
6 else Trend ← Sideways;
7 end for
8 渲染图表 Kt(Pt, κt, Trend);
然而,仅依赖平均斜率 κt 可能具有误导性,因为相似的斜率值可能出现在结构截然不同的市场环境中。为了解决这个问题,该智能体还结合了通道线的几何特征进行推理。例如,在一个明确的上升趋势中,阻力线和支撑线通常会平行向上,表明持续的买盘兴趣。相比之下,当阻力线下降而支撑线上升时,会形成收敛的三角形形态,这往往预示着市场犹豫不决或即将发生转变。通过分析通道的几何结构(平行、收敛或发散),TrendAgent 不仅能推断方向,还能评估趋势的稳定性和信心,从而为下游决策提供了比简单阈值判断更丰富的输入。
3.4 RiskAgent 设计
风险控制是资本保全的关键。RiskAgent 在交易流程中扮演着至关重要的角色,它负责将上游智能体的分析结果整合,并将其转化为一个包含明确交易边界的统一风险回报框架。
RiskAgent 的风险控制机制如下:它采用一个固定的止损值 ρ = 0.0005 来反映短期价格波动。同时,它利用 LLM 根据当前市场环境预测一个风险回报比 r(取值范围在 1.2 到 1.8 之间),并据此计算出止盈水平 R = r · ρ。通过这种方式,RiskAgent 将高层次的市场洞察转化为一致且风险可控的交易行为,确保了资本的保全。
3.5 DecisionAgent 设计
DecisionAgent 是 QuantAgent 框架的最终推理和执行层。其核心任务是整合所有上游智能体(IndicatorAgent、PatternAgent、TrendAgent)的输出,并做出 LONG(做多)或 SHORT(做空)的交易决策(不允许持有)。
该智能体的决策流程始于接收聚合后的信号。它会评估各信号之间的一致性,只有在多数信号对齐并得到确认(例如,指标出现交叉、突破形态完成或价格与主要趋势边界互动)时,才会执行决策。这种分层推理的设计能够有效过滤噪音和相互冲突的输入,从而产生比传统规则系统更稳健和可解释的决策。
在详细介绍了系统架构后,下一节将通过实验来验证该系统的性能。
4. 实验 (Experiments)
本节将介绍 QuantAgent 的实验设计。所有评估均在零样本(zero-shot)设置下进行,这意味着 QuantAgent 在没有经过任何监督微调的情况下,仅基于最近的 K 线数据和基本上下文(如资产类型和时间间隔)自主生成交易决策。此设计旨在测试该框架在真实、数据受限的环境中的适应性和有效性。
4.1 基准构建与评估协议 (Benchmark Construction and Evaluation Protocol)
为了进行全面的评估,我们构建了一个包含多种主流金融资产的基准数据集。这些资产涵盖了多个关键市场类别:
* 加密货币: BTC/USD
* 股票指数: NQ (纳斯达克100期货), ES (标普500 E-mini期货), SPX (标普500指数), QQQ (纳斯达克100 ETF), DJI (道琼斯工业平均指数)
* 大宗商品: GC (黄金期货), CL (原油期货)
我们使用公开的 tvdatafeed API 收集了每种资产的 5,000 根历史 4 小时 OHLC K 线数据。
评估协议如下:对于每种资产,我们随机抽样 100 个评估段。每个评估段包含 100 根连续的 K 线,其中最后 3 根 K 线被保留用于验证,不在推理时提供给模型。系统根据输入数据生成一份结构化的交易报告,其中包含方向预测(LONG 或 SHORT)、决策理由和预估的风险回报比。实验中,我们还引入了一个随机策略作为性能比较的基准。
4.2 评估指标 (Evaluation Metrics)
4.2.1 方向准确性评估 (Directional Accuracy Evaluation)
为了评估预测的正确性,我们将模型的方向预测与采样输入窗口后的未来 3 根 K 线的实际市场走势进行比较。方向准确率 α 的计算方法如下: α = C / T 其中 C 是正确预测的 K 线结果数量,T 是评估的 K 线总数。例如,对于一个 LONG 决策,后续 3 根 K 线中每一根收盘价高于决策点收盘价的 K 线都被视为一次正确的命中。
4.2.2 回报率评估 (Rate of Return (RoR) Evaluation)
我们还使用多个回报率(RoR)指标来评估交易的盈利能力:
* 收盘对收盘回报率 (Rcc): R_{cc} = \begin{cases} \frac{\text{Close}_{t+3}}{\text{Close}_t} - 1 & \text{if LONG} \\ 1 - \frac{\text{Close}_{t+3}}{\text{Close}_t} & \text{if SHORT} \end{cases} 该指标通过比较预测窗口末端的收盘价与初始收盘价,直接衡量已实现的收益或亏损。
* 风险约束回报率 (Rsim): R_{sim} = \begin{cases} \frac{P_{\text{exit}}}{\text{Close}_t} - 1 & \text{if LONG} \\ 1 - \frac{P_{\text{exit}}}{\text{Close}_t} & \text{if SHORT} \end{cases} 该指标模拟了包含止损和止盈行为的现实交易回报。我们假设一个固定的止损阈值 ρ = 0.0005,并使用 LLM 生成的风险回报比 r 来确定止盈水平。P_{exit} 是未来 3 根 K 线中第一个触及止损或止盈目标的价格。
* 最大回报率 (Rmax): R_{max} = \begin{cases} \frac{\text{max}(\text{High}_{t+1:t+3})}{\text{Close}_t} - 1 & \text{if LONG} \\ 1 - \frac{\text{min}(\text{Low}_{t+1:t+3})}{\text{Close}_t} & \text{if SHORT} \end{cases} 该指标代表在预测窗口内可能实现的最佳回报率。
* 最小回报率 (Rmin): R_{min} = \begin{cases} \frac{\text{min}(\text{Low}_{t+1:t+3})}{\text{Close}_t} - 1 & \text{if LONG} \\ 1 - \frac{\text{max}(\text{High}_{t+1:t+3})}{\text{Close}_t} & \text{if SHORT} \end{cases} 该指标代表在同一决策下可能出现的最差回报率。
在定义了实验设置和评估指标后,下一节将展示并分析实验结果。
5. 结果与分析 (Results and Analysis)
本节将详细呈现并深入分析 QuantAgent 的实验结果。分析内容将涵盖跨市场的量化性能比较、样本验证准确性以及具体的案例研究,以全面评估该框架的有效性。
5.1 主要结果 (Main Results)
表 1: 不同交易品种的性能比较。 结果展示了随机基准和我们的方法(绿色高亮)的对比。粗体值表示有所改进,向上箭头表示值越高越好。
资产 方法 准确率 α % ↑ Δα (% ↑) Rcc ↑ Rmax ↑ Rmin ↑ Rsim ↑
BTC Baseline 44.3 – -0.259 1.115 -1.366 -0.277
Our 50.7 +14.5% 0.081 1.232 -1.249 0.004
CL Baseline 49.0 – -0.312 0.999 -1.384 -0.255
Our 57.7 +17.8% -0.195 1.181 -1.202 -0.133
DJI Baseline 49.0 – -0.096 0.770 -0.792 -0.131
Our 51.0 +4.1% 0.159 0.804 -0.758 0.121
ES Baseline 41.3 – 0.006 0.560 -0.539 0.006
Our 55.0 +33.2% 0.179 0.613 -0.485 0.179
GC Baseline 47.7 – 0.018 0.502 -0.449 0.018
Our 51.3 +8.4% 0.727 0.517 -0.434 0.027
NQ Baseline 41.3 – -0.033 0.717 -0.736 -0.033
Our 53.3 +29.1% 0.078 0.747 -0.705 0.078
QQQ Baseline 39.7 – -0.265 0.966 -1.038 -0.252
Our 59.7 +50.4% 0.189 1.052 -0.952 0.193
SPX Baseline 39.0 – -0.108 0.789 -0.846 -0.090
Our 62.0 +59.0% 0.207 0.917 -0.717 0.197
表 1 的数据显示,QuantAgent 在所有八种资产上的表现均优于随机基准。
* 准确率显著提升: QuantAgent 在所有资产上的方向预测准确率(α)均高于基准。在股票指数市场,提升尤为显著,例如在 SPX 上提升了 23 个百分点,在 QQQ 上提升了 20 个百分点,在 ES 上也提升了 14 个百分点。
* 回报率改善: 准确率的提升直接转化为正向的回报率(Rcc)。在八个市场中的六个,QuantAgent 将亏损转为盈利。例如,在 SPX 上的回报率从 -0.108 提升至 0.207,在 DJI 上从 -0.096 提升至 0.159。
* 有效的风险控制: 在模拟了止损和止盈的风险约束回报率(Rsim)上,QuantAgent 能够有效降低风险并改善收益。例如,在 QQQ 上的回报率从 -0.252 的大幅亏损转为 0.193 的盈利,在 SPX 上也从 -0.090 转为 0.197。
* 捕捉上行空间,限制下行风险: 在 BTC 这样的波动性资产上,QuantAgent 在提升最大可能回报(Rmax 从 1.115 增至 1.232)的同时,也有效控制了最小可能回报(Rmin)所代表的下行风险,显示出系统在不同市场环境下的良好适应性。
5.2 基于样本的验证准确性 (Sample-Based Verification Accuracy)
为了评估系统在短周期内预测的一致性,我们采用了一种抽样验证方法。在一个从 SPX 市场随机抽取的样本段中,系统生成了 10 个方向性信号,并与后续价格走势进行对比。Figure 6 是一张展示模型预测与 SPX 价格走势对比的图表,它清晰地说明了这种高准确率,图中显示样本窗口内的 10 个信号中有 8 个是正确的,准确率达到了 80%。
* 成功的卖出交易(索引 0 和 3): 在这两个案例中,价格反弹至一个熟悉的阻力位后停滞,动量指标转为负向。系统建议卖出,随后的价格下跌验证了决策的正确性。
* 成功的买入交易(索引 1, 4, 5, 6, 8, 9): 这些案例中,动量指标刚刚转为正向,价格或从支撑位反弹,或收复失地。同时,模式检测智能体也识别出了支撑性结构,如“V形”复苏或圆形底部。由于多方信号一致,买入决策获得了即时回报。
* 失败的交易(索引 2 和 7): 这两次错误的共同点是,模型过度依赖一个尚未完成的图表模式(如索引 2 的双重底),而忽略了价格在强阻力位附近能量耗尽的信号(如缩小的 K 线实体)。这表明,未来可以通过优化对不同信号(新兴模式 vs. 能量耗尽)的权重分配来进一步改进模型。
5.3 案例研究 (Case Studies)
PatternAgent 案例分析
在一张关于 CL(原油)的案例图(Figure 7)中,PatternAgent 成功识别出一个“下降三角形”模式。 该智能体首先提取了近期的摆动高点和低点。它发现,连续的高点形成了一条向下倾斜的阻力线,而低点则聚集在一个水平的支撑位附近。随着两条线的收敛,该智能体将此形态归类为下降三角形,并生成了关于其结构(更低的高点 vs. 水平的支撑)、趋势(看跌突破倾向)和对称性(三角形收敛)的结构化摘要。
TrendAgent 案例分析
在一张关于 DJI(道琼斯指数)的案例图(Figure 8)中,TrendAgent 对趋势进行了分析。 它通过对近期的收盘价进行拟合,生成了一条向上倾斜的阻力线和一条相对平坦的支撑线,形成了一个上升通道。同时,它统计了连续的摆动高点和低点,确认了“更高的高点和更高的低点”序列,进一步强化了上升趋势的判断。最终,该智能体综合这些几何诊断,生成了关于阻力线、支撑线和价格行为的摘要,并得出了“看涨信号”的综合评估。
IndicatorAgent 案例分析
一组详细的多面板图(Figure 9)展示了 IndicatorAgent 如何综合分析多个技术指标。 面对 DJI 的价格数据,该智能体分别评估了 RSI、MACD、ROC、Stochastic 和 Williams %R。
* RSI 大部分时间位于 50 以上,显示出看涨趋势,但近期值接近 68.49,暗示市场接近超买。
* MACD 线位于信号线上方,直方图为正,确认了看涨动量。
* ROC 值为正,表明动量向上。
* Stochastic 和 Williams %R 均处于超买区域(>80 和 >-20),警示市场可能过热。
尽管 MACD 和 ROC 等动量指标确认了看涨趋势,但 Stochastic 和 Williams %R 等振荡指标发出的超买信号引入了一个关键的警示。IndicatorAgent 的最终结论——“看涨但超涨”(bullish but extended)——并非简单的信号平均,而是一种综合了不同信号维度的微妙判断。它优先考虑了已建立的动量,同时标记了动能耗尽的直接风险,从而建议交易者谨慎行事,警惕潜在的回调,而不是积极建立新的多头头寸。
通过对量化性能、样本准确性和具体案例的深入分析,QuantAgent 的有效性得到了充分验证。接下来,我们将对全文进行总结。
6. 结论 (结论)
本文介绍了 QuantAgent,一个为高频交易环境设计的新型多智能体框架,它将经典的量化分析与大语言模型的推理能力相结合。该框架的设计灵感来源于机构交易台的劳动分工模式,通过 IndicatorAgent、PatternAgent、TrendAgent 和 RiskAgent 等专业智能体协同工作,以实现高效和抗噪音的交易决策。一个核心的设计理念是,系统完全基于价格行为进行决策,认为价格本身已包含了所有可用的市场信息。
我们的实证评估结果表明,在零样本设置下,QuantAgent 在八种金融工具上的表现持续优于随机基准,无论是在方向预测准确性还是在多种回报率指标上。这些发现证明了将结构化的技术信号与模块化的 LLM 工作流相结合的可行性,为在传统量化交易和现代语言驱动推理之间架起了一座桥梁,特别是在高频交易的约束条件下。
7. 局限性与未来工作 (Limitations and Future Work)
尽管 QuantAgent 展现了良好的前景,但我们仍需坦诚地讨论其当前存在的局限性,并为未来的研究指明方向。
1. 速度与微观时域准确性问题: 模型的预测精度在超短时间周期(如 1-15 分钟)上会下降。在这样的时间尺度上,价格序列充满了噪音和快速的状态切换,这使得当前的零样本 LLM 难以区分短暂的尖峰和可交易的信号。
2. 非真正的实时系统: 当前的系统架构并非真正的实时系统。每个推理周期都涉及对 LLM 的调用和多个工具的使用,这会引入延迟,可能导致系统无法抓住 1 分钟级别的交易机会。
针对上述局限性,未来的研究可以探索以下方向:简化工具的调用流程、缓存中间特征以减少重复计算,或者将关键的逻辑转移到更轻量级的边缘模型上执行,从而显著降低延迟,使其更接近实时交易的要求。
参考文献 (References)
Gerald Appel. Technical Analysis: Power Tools for Active Investors. FT Press, reprint edition, 2005. ISBN 9780132930048.
Rishi Bommasani, Drew A. Hudson, Ehsan Adeli, Russ B. Altman, Simran Arora, Sydney von Arx, Michael S. Bernstein, Jeannette Bohg, Antoine Bosselut, Emma Brunskill, Erik Brynjolfsson, Shyamal Buch, Dallas Card, Rodrigo Castellon, Niladri S. Chatterji, Annie S. Chen, Kathleen Creel, Jared Quincy Davis, Dorottya Demszky, Chris Donahue, Moussa Doumbouya, Esin Durmus, Stefano Ermon, John Etchemendy, Kawin Ethayarajh, Li Fei-Fei, Chelsea Finn, Trevor Gale, Lauren E. Gillespie, Karan Goel, Noah D. Goodman, Shelby Grossman, Neel Guha, Tatsunori Hashimoto, Peter Henderson, John Hewitt, Daniel E. Ho, Jenny Hong, Kyle Hsu, Jing Huang, Thomas Icard, Saahil Jain, Dan Jurafsky, Pratyusha Kalluri, Siddharth Karamcheti, Geoff Keeling, Fereshte Khani, Omar Khattab, Pang Wei Koh, Mark S. Krass, Ranjay Krishna, Rohith Kuditipudi, and et al. On the opportunities and risks of foundation models. CoRR, abs/2108.07258, 2021. URL https://arxiv.org/abs/2108.07258.
Sugato Chakravarty, Asani Sarkar, and Lifan Wu. Information asymmetry, market segmentation and the pricing of cross-listed shares: theory and evidence from chinese a and b shares. Journal of International Financial Markets, Institutions and Money, 8(3):325–356, 1998. ISSN 1042-4431. doi: https://doi.org/10.1016/S1042-4431(98)00041-9. URL https://www.sciencedirect.com/science/article/pii/S1042443198000419.
Tai-liang Chen and Feng-yu Chen. An intelligent pattern recognition model for supporting investment decisions in stock market. Information Sciences, 346–347:261–274, 2016. doi: 10.1016/j.ins.2016.01.060.
Tarun Chordia, Amit Goyal, Bruce N. Lehmann, and Gideon Saar. High-frequency trading. Journal of Financial Markets, 16(4):637–645, 2013. ISSN 1386-4181. doi: https://doi.org/10.1016/j.finmar.2013.06.004. URL https: //www.sciencedirect.com/science/article/pii/S1386418113000268. High-Frequency Trading.
Matthew F. Dixon, Igor Halperin, and Paul Bilokon. Machine Learning in Finance: From Theory to Practice. Springer, 1st edition, 2020. ISBN 978-3030410674.
Thanh Nam Duong, Trung Kien Hoang, Quoc Khanh Duong, Quoc Dat Dinh, Duc Hoan Le, Huy Tuan Nguyen, Xuan Bach Nguyen, and Quy Ban Tran. Investigating market strength prediction with cnns on candlestick chart images, 2025. URL https://arxiv.org/abs/2501.12239.
Eugene F. Fama. Efficient capital markets: A review of theory and empirical work. The Journal of Finance, 25(2): 383–417, 1970. doi: 10.2307/2325486. URL https://doi.org/10.2307/2325486.
Eugene F. Fama and James D. MacBeth. Risk, return, and equilibrium: Empirical tests. Journal of Political Economy, 81(3):607–636, 1973. ISSN 00223808, 1537534X. URL http://www.jstor.org/stable/1831028.
Joel Hasbrouck and Gideon Saar. Low-latency trading. Journal of Financial Markets, 16(4):646–679, 2013. doi: 10.1016/j.finmar.2013.05.003.
Investopedia. Stochastic oscillator: What it is, how it works, how to . . . . https://www.investopedia.com/terms/s/ stochasticoscillator.asp, n.d. Accessed: 2025-08-14.
Narasimhan Jegadeesh and Sheridan Titman. Returns to buying winners and selling losers: Implications for stock market efficiency. The Journal of Finance, 48(1):65–91, 1993. doi: 10.2307/2328882. URL https://doi.org/10.2307/2328882.
Robert Kissell. The Science of Algorithmic Trading and Portfolio Management. Academic Press, San Diego, 1st edition, 2013. ISBN 978-0124016897.
Inc. LangChain. Langgraph: A low-level orchestration framework for building, managing, and deploying long-running, stateful agents. https://langchain-ai.github.io/langgraph/, 2025. Accessed: 2025-07-01.
Xiao-Yang Liu, Ziyi Xia, Jingyang Rui, Jiechao Gao, Hongyang Yang, Ming Zhu, Christina Dan Wang, Zhaoran Wang, and Jian Guo. Finrl-meta: Market environments and benchmarks for data-driven financial reinforcement learning, 2022. URL https://arxiv.org/abs/2211.03107.
Andrew W. Lo. Risk management for hedge funds: 引言 and overview. Financial Analysts Journal, 57(6):16–33, 2001. ISSN 0015198X. URL http://www.jstor.org/stable/4480353.
Andrew W. Lo, Harry Mamaysky, and Jiang Wang. Foundations of technical analysis: Computational algorithms, statistical inference, and empirical implementation. NBER Working Paper 7613, National Bureau of Economic Research, March 2000. URL https://ssrn.com/abstract=228099. Available at SSRN.
Tobias J Moskowitz, Yao Hua Ooi, and Lasse Heje Pedersen. Time series momentum. Journal of financial economics, 104(2):228–250, 2012.
John J Murphy. Technical analysis of the financial markets: A comprehensive guide to trading methods and applications. Penguin, 1999.
Thien Hai Nguyen, Kiyoaki Shirai, and Julien Velcin. Sentiment analysis on social media for stock movement prediction. Expert Systems with Applications, 42(24):9603–9611, 2015. ISSN 0957-4174. doi: https://doi.org/10.1016/j.eswa.2015.07.052. URL https://www.sciencedirect.com/science/article/pii/S0957417415005126.
Steve Nison. Japanese Candlestick Charting Techniques. Prentice Hall Press, New York, 2nd edition, October 2001.
OpenAI, Josh Achiam, Steven Adler, Sandhini Agarwal, and et al. Gpt-4 technical report, 2024. URL https://arxiv. org/abs/2303.08774.
M.Hashem Pesaran and Allan Timmermann. How costly is it to ignore breaks when forecasting the direction of a time series? International Journal of Forecasting, 20(3):411–425, 2004. ISSN 0169-2070. doi: https://doi.org/10.1016/ S0169-2070(03)00068-2. URL https://www.sciencedirect.com/science/article/pii/S0169207003000682.
Robert R. Prechter. Elliott Wave Principle: Key to Market Behavior. New Classics Library, Gainesville, GA, February 2005.
Martin J Pring. Technical analysis explained: The successful investor’s guide to spotting investment trends and turning points. (No Title), 1991.
Yao Qin, Dongjin Song, Haifeng Chen, Wei Cheng, Guofei Jiang, and Garrison Cottrell. A dual-stage attention-based recurrent neural network for time series prediction, 2017. URL https://arxiv.org/abs/1704.02971.
rongardF. tvdatafeed: A simple tradingview historical data downloader (github repository). https://github.com/ rongardF/tvdatafeed. Accessed: 2025-08-16.
Timo Schick, Jane Dwivedi-Yu, Roberto Dess̀ı, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, and Thomas Scialom. Toolformer: Language models can teach themselves to use tools, 2023. URL https://arxiv.org/ abs/2302.04761.
Omer Berat Sezer and Ahmet Murat Ozbayoglu. Algorithmic financial trading with deep convolutional neural networks: Time series to image conversion approach. Applied Soft Computing, 70:525–538, 2018. ISSN 1568-4946. doi: https: //doi.org/10.1016/j.asoc.2018.04.024. URL https://www.sciencedirect.com/science/article/pii/S1568494618302151.
Matheus Gomes Sousa, Kenzo Sakiyama, Lucas de Souza Rodrigues, Pedro Henrique Moraes, Eraldo Rezende Fernandes, and Edson Takashi Matsubara. Bert for stock market sentiment analysis. In 2019 IEEE 31st International Conference on Tools with Artificial Intelligence (ICTAI), pages 1597–1601, 2019. doi: 10.1109/ICTAI.2019.00231.
Robert Tumarkin and Robert F. Whitelaw. News or noise? internet postings and stock prices. Financial Analysts Journal, 57(3):41–51, 2001. URL http://www.jstor.org/stable/4480315.
Ziao Wang, Yuhang Li, Junda Wu, Jaehyeon Soon, and Xiaofeng Zhang. Finvis-gpt: A multimodal large language model for financial chart analysis, 2023. URL https://arxiv.org/abs/2308.01430.
Jiaqi Wei, Hao Zhou, Xiang Zhang, Di Zhang, Zijie Qiu, Wei Wei, Jinzhe Li, Wanli Ouyang, and Siqi Sun. Alignrag: An adaptable framework for resolving misalignments in retrieval-aware reasoning of rag. arXiv e-prints, pages arXiv–2504, 2025.
Welles Wilder. New Concepts in Technical Trading Systems. Trend Research, 1978.
Larry Williams. The Long-Term Secrets to Short-Term Trading. Wiley, 2nd edition, 2011. ISBN 9780470915738.
Yijia Xiao, Edward Sun, Di Luo, and Wei Wang. Tradingagents: Multi-agents llm financial trading framework, 2025. URL https://arxiv.org/abs/2412.20138.
Hongyang Yang, Xiao-Yang Liu, and Christina Dan Wang. Fingpt: Open-source financial large language models, 2023. URL https://arxiv.org/abs/2306.06031.
Yi Yang, Mark Christopher Siy UY, and Allen Huang. Finbert: A pretrained language model for financial communications, 2020. URL https://arxiv.org/abs/2006.08097.
Yuwei Yin, Jean Kaddour, Xiang Zhang, Yixin Nie, Zhenguang Liu, Lingpeng Kong, and Qi Liu. Ttida: Controllable generative data augmentation via text-to-text and text-to-image models. arXiv preprint arXiv:2304.08821, 2023.
Yangyang Yu, Haohang Li, Zhi Chen, Yuechen Jiang, Yang Li, Denghui Zhang, Rong Liu, Jordan W. Suchow, and Khaldoun Khashanah. Finmem: A performance-enhanced llm trading agent with layered memory and character design. arXiv preprint arXiv:2311.13743, 2023.
Yangyang Yu, Zhiyuan Yao, Haohang Li, Zhiyang Deng, Yuechen Jiang, Yupeng Cao, Zhi Chen, Jordan W. Suchow, Zhenyu Cui, Rong Liu, Zhaozhuo Xu, Denghui Zhang, Koduvayur Subbalakshmi, Guojun Xiong, Yueru He, Jimin Huang, Dong Li, and Qianqian Xie. Fincon: A synthesized llm multi-agent system with conceptual verbal reinforcement for enhanced financial decision making. In Proceedings of the 38th Conference on Neural Information Processing Systems (NeurIPS), 2024. To appear.
Umair Zakir, Evan Daykin, Amssatou Diagne, and Jacob Faile. Advanced deep learning techniques for analyzing earnings call transcripts: Methodologies and applications, 2025. URL https://arxiv.org/abs/2503.01886.
Xiang Zhang, Senyu Li, Bradley Hauer, Ning Shi, and Grzegorz Kondrak. Don’t trust chatgpt when your question is not in english: a study of multilingual abilities and types of llms. arXiv preprint arXiv:2305.16339, 2023a.
Xiang Zhang, Ning Shi, Bradley Hauer, and Grzegorz Kondrak. Bridging the gap between babelnet and hownet: Unsupervised sense alignment and sememe prediction. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics, pages 2789–2798, 2023b.
Xiang Zhang, Senyu Li, Ning Shi, Bradley Hauer, Zijun Wu, Grzegorz Kondrak, Muhammad Abdul-Mageed, and Laks VS Lakshmanan. Cross-modal consistency in multimodal large language models. arXiv preprint arXiv:2411.09273, 2024.
Xiang Zhang, Juntai Cao, Jiaqi Wei, Yiwei Xu, and Chenyu You. Tokenization constraints in llms: A study of symbolic and arithmetic reasoning limits. arXiv preprint arXiv:2505.14178, 2025a.
Xiang Zhang, Juntai Cao, Jiaqi Wei, Chenyu You, and Dujian Ding. Why prompt design matters and works: A complexity analysis of prompt search space in llms. arXiv preprint arXiv:2503.10084, 2025b.
--------------------------------------------------------------------------------
附录 (Appendix)
附录A: 为何仅靠技术分析足以进行交易
QuantAgent 是一个多模态、多智能体的高频交易 LLM 框架,它仅基于价格数据进行市场预测,忽略了新闻、社交媒体等其他信息。这种策略被称为技术分析。技术分析的前提是,仅靠价格就足以捕捉市场动态并预测未来趋势,这一观点已得到先前研究的广泛探讨。本节将详细阐述为何仅靠技术分析足以进行交易。
技术分析的第一个原则是,所有相关信息,无论是经济、政治、心理还是其他因素,都已反映在市场价格中。换言之,价格会迅速对新动态做出调整,因为人们会通过买卖来对他们收到的信息采取行动。这些行动记录在价格变化中。因此,通过观察价格如何变动,就可以间接理解整个市场对公开和私有信息的反应,而无需显式处理这些信息。我们的系统因此也遵循这一原则,让每个智能体仅基于价格数据进行分析。
技术分析假设价格变动并非完全随机,而是倾向于随时间形成模式。当价格开始上涨时,它们通常会持续上涨一段时间;同样,下跌趋势在反转前也会持续存在。这些趋势往往反映了集体的人类行为,如下跌时的恐惧或上涨时的乐观。通过及早识别这些趋势,技术交易者旨在做出与市场大方向一致的决策。QuantAgent 的运作方式正是捕捉市场模式并利用这一价格变动假设。
值得注意的是,许多现有的技术分析方法都基于一个观察:某些价格模式倾向于重复出现。这种重复性归因于市场参与者稳定的行为倾向。例如,交易者对价格涨跌的反应通常是相似的,从而导致了顶、底和反转等重复出现的模式。识别并响应这些熟悉的结构,使得技术系统能够在不理解每次变动具体原因的情况下做出预测。这种可观察的重复性天然适合于智能体框架,因为 LLM 智能体已显示出强大的模式和趋势推理能力,达到了类似人类的水平。
有时,价格变动远早于任何官方信息向公众发布。例如,一家公司的股价可能在宣布强劲盈利前几天甚至几周就开始上涨。这可能是因为某些投资者——如员工、供应商或专业分析师——可能已经掌握了公司业绩的内幕信息,例如销售活动增加或产量异常高。同样,在丑闻消息公开前,价格可能已经下跌。如果存在法律调查或管理层异常行为的传闻,知情的交易者可能会提前开始抛售,导致价格预先下跌。在这两种情况下,价格都领先于新闻,因为市场集体对早期信号、预期或私有信息做出了反应。技术分析通过价格行为直接捕捉这些变动,而无需获取其根本原因。这使得交易系统能够在变化一出现于市场时就做出反应,而不是等待延迟或不完整的公开信息。
总之,我们的智能体在技术分析的原则下工作,这为理解市场行为提供了一种实用且自洽的方法。通过假设所有可用信息都已融入价格数据中,并且人类对价格变动的反应倾向于遵循一致的模式,我们的智能体便有可能在不依赖外部输入的情况下预测未来的价格方向。
附录B: 智能体设计
B.1 IndicatorAgent
为了实现 IndicatorAgent 的功能,我们设计了一个特定于任务的提示,引导智能体在严格的延迟约束下提取和解释技术指标。
提示
你是一名在高频交易(HFT)环境中工作、受严格延迟约束的分析助理。
你必须分析技术指标以支持快节奏的交易执行。
你可以使用以下工具:
* 计算 rsi
* 计算 macd
* 计算 roc
* 计算 stoch
* 计算 willr
通过提供诸如‘kline data’和相应周期的参数来使用它们。
提供的 OHLC 数据来自 {{time frame}} 时间间隔,反映了近期的市场行为。
你必须快速准确地解释这些数据。
这是 OHLC 数据:{{kline data}}。调用必要的工具,并分析结果。
这是我们多智能体 LLM 框架中 IndicatorAgent 的提示。该智能体接收近期的 OHLC 数据作为输入,并通过工具辅助进行分析。诸如 kline data 和 time frame 等变量是动态实例化的,使智能体能够提取有意义的价格变动,并使其输出适应不同的市场条件。
B.2 PatternAgent
为了实例化 PatternAgent,我们构建了一个提示,指示智能体从 OHLC 序列中识别几何形态(例如,顶、底、盘整),利用 LLM 的多模态推理能力进行 K 线图和图表模式分析。
提示
你是一名交易模式识别助理,任务是识别经典的高频交易模式。
你可以使用工具:generate kline image。
通过提供诸如‘kline data’的参数来使用它。
图表生成后,将其与经典模式描述进行比较,并确定是否存在任何已知模式。...
这是我们多智能体 LLM 框架中 PatternAgent 的提示。该智能体接收 OHLC 数据作为输入,将其转换为可视化表示,并从模式识别的角度分析该序列。
提示
这是一张根据近期 OHLC 市场数据生成的 {{time frame}} K线图。请参考以下经典 K 线模式:
1. 反转头肩形:三个低点,中间的最低;结构对称,通常预示着上升趋势。
2. 双重底:两个相似的低点,中间有一次反弹,形成一个“W”形。
3. 圆形底:逐渐下跌后逐渐上涨(“U”形)。
4. 隐藏底:横盘整理后突然向上突破。
5. 下降楔形:范围向下收窄,通常向上解决。
6. 上升楔形:范围向上收窄,通常向下解决。
7. 上升三角形:支撑线上升,阻力线平坦;通常向上突破。
8. 下降三角形:阻力线下降,支撑线平坦;通常向下突破。
9. 看涨旗形:急剧上涨后短暂的向下通道,然后继续上涨。
10. 看跌旗形:急剧下跌后短暂的向上通道,然后继续下跌。
11. 矩形:在水平支撑/阻力线之间的横盘范围。
12. 岛形反转:两个方向相反的缺口形成一个“岛屿”。
13. V形反转:急剧下跌后急剧回升(反之亦然)。
14. 圆形顶/底:逐渐见顶或见底,呈弧形。
15. 扩张三角形:高点和低点范围变宽,波动剧烈。
16. 对称三角形:高点和低点收敛;在顶点后突破。
确定图表是否与这些模式中的任何一个匹配。
说出检测到的模式名称,并根据结构、趋势和对称性解释你的选择。
这是我们多智能体 LLM 框架中 PatternAgent 的图表分析提示。智能体被提供一个由工具生成的图表和一份包含经典结构模式(如“U”形、“W”形、三角形)的文本库。它会自动评估图表是否与这些模式中的任何一个匹配,并从结构、方向和对称性三个维度解释其推理。
B.3 TrendAgent
对于 TrendAgent,我们提供了一个强调检测多时间跨度方向性动量的提示,使智能体能够在响应短周期信号的同时,对中长期趋势进行推理。
提示
你是一名在高频交易环境中运作的 K 线趋势模式识别助理。
你必须首先使用提供的‘kline data’调用工具‘generate trend image’。
图表生成后,分析图像中的支撑/阻力趋势线和已知的 K 线模式。
只有这样,你才能对短期趋势(向上、向下或横盘)做出预测。
在生成和分析图像之前,不要做任何预测。
这是我们多智能体 LLM 框架中 TrendAgent 的提示。该智能体将时间序列 OHLC 数据转换为工具生成的图表,并对可视化结果进行趋势分析,以识别方向性动量和潜在的突破。
提示
你是一名高频交易环境中的 K 线趋势模式识别助理。以下 {{time frame}} K线图包含两条自动生成的趋势线:蓝线是支撑线,红线是阻力线,两者均源自近期的收盘价。
分析价格...,K 线是在它们之间反弹、突破还是压缩?
根据趋势线的斜率...,预测可能的短期趋势:向上、向下或横盘。
用预测、推理和信号来支持你的预测。
这是我们多智能体 LLM 框架中 TrendAgent 的基于图表的提示。智能体被提供一个包含两条参考线(蓝色支撑线和红色阻力线)的工具生成图表。它分析价格行为如何与这些线条互动,并产生一个短期的趋势预测(向上、向下或横盘),同时附带涵盖预测、推理和信号的结构化输出。
B.4 DecisionAgent
为了实现 DecisionAgent,我们设计了一个提示,促使 DecisionAgent 将所有专业智能体的信号整合成连贯的交易行动,平衡高频市场环境中的盈利能力、风险和可解释性。
提示
你是一名高频量化交易(HFT)分析师,正在审查 {{stock name}} 的当前 {{time frame}} K线图。立即发出执行指令:做多(LONG)或做空(SHORT)。(禁止持有 HOLD。)预测范围:预测接下来 3 根 K 线的价格方向(例如,15分钟图 → 接下来15分钟;4小时图 → 接下来4小时)。以下是根据你提供的简洁结构和语调重构的决策指南:—— 你的决策应基于三份报告:
1. 技术指标报告 —— 评估动量(MACD, ROC)和振荡器(RSI, Stochastic, Williams %R)。优先考虑强信号(例如,MACD 交叉,RSI 背离,极端水平)。除非跨类型指标一致,否则降低混合或中性指标的权重。
2. 模式报告 —— 仅在有突破或跌破确认的明确形成的看涨/看跌模式上采取行动(例如,强影线,成交量激增,吞噬形态)。忽略没有其他报告支持的早期或盘整形态。
3. 趋势报告 —— 分析价格与趋势线的互动:上升的支撑线 = 买入兴趣;下降的阻力线 = 卖压。对于压缩区域,仅在有明确的 K 线或指标共识时才行动。不要仅从几何形状推断突破方向。
决策策略:
* 仅在所有三份报告中都有确认且一致的信号时才采取行动。
* 偏好强劲的动量和果断的价格行为(例如,MACD 交叉,拒绝影线,突破 K 线)。
* 如果报告冲突,选择有更强、更新近确认的一方。
* 在盘整或不明确的设置中,遵循主导趋势线的斜率(例如,在下降通道中做空)。
* 不要投机——选择更具防御性的一方。
* 建议一个介于 1.2 和 1.8 之间的风险回报比,根据波动性和趋势强度进行调整。
— 如果您希望此格式直接用 LaTeX 代码或导出为 PDF,请告诉我。输出 JSON:
{
"forecast_horizon": "预测接下来的 N 根 K 线(具体说明)",
"decision": "做多或做空",
"justification": "简明扼要的确认理由",
"risk_reward_ratio": "1.2 - 1.8"
}
这是我们多智能体 LLM 框架中 DecisionAgent 的提示。该智能体整合了三个上游视角:指标信号、结构模式和趋势互动,并输出一个短期的方向性决策(做多或做空)。该提示指示智能体优先考虑一致的证据,避免投机性输出,并提供包括预估风险回报比在内的结构化理由。
B.5 模式工具示例输出
图10:为 PatternAgent 在 NQ (2025) 上由工具生成的图表。该图展示了 7 月 7-8 日窗口的原始日内 K 线,在叠加参考线之前。更低的高点和更高的低点序列表明交易范围正在收缩,暗示着一旦边界被突破,通常会先于突破的潜在压力。
B.6 趋势工具示例输出
图11:为 TrendAgent 在 NQ (2025) 上由工具生成的图表。日内 K 线在一条向上倾斜的支撑线(蓝色)和一条向下倾斜的阻力线(红色)之间压缩,形成一个对称三角形楔形。收敛的边界表明一个盘整阶段,买方压力逐渐增强,而卖方则限制了反弹,这通常预示着一旦边界被突破,将出现决定性的突破。
附录C: Web 演示
图12:QuantAgent 的用户界面。配置面板允许选择交易资产(如 AAPL)、时间框架和分析窗口。它支持实时数据输入,对历史 K 线范围进行精细控制,并确保安全的本地执行。默认情况下,系统使用最近 40-50 根价格 K 线来优化上下文,以平衡相关性和计算效率。
图13:QuantAgent 的交易决策界面。系统产生最终的方向性决策,以及预测范围、风险回报比和基于模式识别(例如,圆形底反转)的文本理由。
图14:QuantAgent 的 IndicatorAgent 界面。显示一份结构化的 IndicatorAgent 报告,总结了关键技术指标,包括 MACD、RoC、随机振荡器和威廉姆斯 %R,以支持可解释性并验证决策过程。
图15:QuantAgent 生成的模式和趋势报告。顶部面板呈现了一个检测到的双重底模式,由结构对称性、先前的下降趋势和随后的反弹所支持。附带的图表叠加层突出了该模式的几何形状。底部面板提供了趋势诊断,包括 ADX、RSI 背离和成交量分析,以及支撑和阻力位的可视化。模式和趋势模块共同为潜在的趋势反转和市场复苏提供了互补的视角。
附录D: 基准测试详情
D.1 基准构建
为了评估所提出的 QuantAgent 框架,我们设计了一个由多样化的、著名的金融资产组成的基准。该基准使我们能够系统地测试系统在不同资产类别和交易环境中的泛化能力。该基准还有助于在不同决策模型之间进行受控比较,并确保可复现性。
D.2 数据收集和资产选择
基准中使用的所有历史价格数据均通过公开可用的 tvdatafeed API 获取,该 API 提供了对 TradingView 历史市场数据的访问。我们对所有资产使用 4 小时 OHLC(开盘价、最高价、最低价、收盘价)K 线数据,以保持时间分辨率的一致性。基准涵盖了多种资产类型,包括加密货币(BTC/USD)、大宗商品(CL 和 GC)、股指期货(ES 和 NQ)以及交易所交易或现货指数(QQQ, SPX, 和 DJI)。每种资产都交易广泛且流动性高,有助于避免低交易活动带来的噪音,并确保价格变动反映真实的市场行为。此外,所选资产既包括相对稳定、趋势性强的工具(如 SPX 和 ES),它们通常表现出更平滑的方向性运动,也包括更具波动性的资产(如 BTC/USD),它们以快速波动和高短期变异性而闻名。
对于每种资产,我们收集了 5,000 根历史 4 小时 K 线,这对于每周五天、每天 24 小时交易的资产来说,大约相当于三年的数据。为确保跨资产的公平性和一致性,我们对所有工具都应用了相同的固定 K 线数量——包括那些交易时间有限的工具,如 QQQ。因此,日内交易频率较低的资产会跨越更长的历史时期(长达十年),反映了可用 K 线间隔的密度较低。从这些数据中,我们为每种资产随机抽取 100 个评估段。每个段包含 100 根连续的 K 线,在推断过程中会移除最后 3 根 K 线,以确保系统在预测时不会观察到真实的市场结果。最后三根 K 线保留用于验证 LLM 预测的正确性。
D.3 基准资产属性
表 2: 基准资产属性概览。 每个资产都通过其名称、市场类型、数据收集窗口的开始和结束日期以及采样的总 K 线数量来表征。所有资产均使用 4 小时 OHLC 间隔采样,每种资产固定总共 5,000 根 K 线以确保可比性。
资产 市场类型 开始日期 结束日期 总 K 线数
BTC/USD 加密货币 2023-04-01 2025-06-23 5000
CL (原油) 大宗商品期货 2022-04-25 2025-06-19 5000
DJI 股票指数 (现货) 2015-08-26 2025-05-16 5000
ES (标普500) 股指期货 2022-04-19 2025-06-19 5000
GC (黄金) 大宗商品期货 2022-04-25 2025-06-19 5000
NQ (纳斯达克) 股指期货 2022-04-19 2025-06-19 5000
QQQ 股票ETF 2015-08-24 2025-05-16 5000
SPX 股票指数 (现货) 2015-08-25 2025-05-16 5000
D.4 基准资产详情
我们在一组来自全球金融市场主要领域的八种多样化基准资产上评估我们的模型。
* BTC/USD (比特币) 显示一个比特币值多少美元。它代表了更广泛的加密货币市场,交易量大且持续运作。
* CL (原油) 追踪西德克萨斯中质原油的价格,这是美国能源价格的关键基准,也是受供需和地缘政治因素影响的全球指标。
* ES (E-mini S&P 500) 是一种与标准普尔500指数挂钩的期货合约,该指数包括500家美国大型上市公司。它提供了美国股市表现的广阔图景。
* GC (黄金) 反映了黄金的市场价格,这是一种在经济不确定时期投资者常用来保值的商品。
* NQ (E-mini Nasdaq-100) 追踪纳斯达克100指数,该指数专注于在纳斯达克交易所上市的大型非金融公司,尤其是在技术和创新领域。
* QQQ 是一种交易所交易基金(ETF),旨在匹配纳斯да克100指数的表现。它为投资者提供了一种简单的方式来投资美国主要的科技和成长股。
* SPX (S&P 500 指数) 直接追踪标准普尔500指数,被广泛用作衡量美国股市整体表现的基准。
* DJI (道琼斯工业平均指数) 包括30家美国大型知名公司,涵盖不同行业。它通常被用作更广泛的美国经济的指标。
D.5 结论
该基准为评估跨多种资产类别的交易系统提供了一个一致且全面的环境。通过标准化数据分辨率和分段格式,它确保了公平和可复现的比较,同时仍然捕捉到了真实世界市场中的多样性。包含稳定、趋势性强的资产和更具波动性的工具,使得在像 QuantAgent 这样的多智能体高频交易框架内能够对模型性能进行有意义的压力测试。


