金融欺诈检测白皮书:经典机器学习与量子混合模型的比较分析
1. 引言:金融欺诈检测的新前沿
金融机构因欺诈活动面临着重大的财务和声誉风险。统计数据显示,2022年,欧洲经济区(EEA)主要支付工具的欺诈损失总额高达43亿欧元,而跨境交易的风险更高。与EEA内部交易相比,涉及EEA以外对手方的银行卡支付欺诈率要高出十倍。除了直接的财务成本,欺诈行为还会严重侵蚀客户的信任。一项近期的行业分析指出,超过30%的欺诈受害者会选择更换其金融机构,这凸显了建立强大安全体系的紧迫性。
当前面临的核心挑战是,欺诈活动的数量和复杂性日益增加,这给传统的检测系统带来了巨大压力,而这些系统往往因高误报率(false-positive rates)而效率低下。经典机器学习(ML)虽然多年来一直是欺诈检测系统的基石,但其能力正被不断升级的欺诈手段和海量数据推向极限。
本分析报告旨在对成熟的经典机器学习模型与新兴的量子机器学习(QML)模型在金融欺诈二元分类任务中的效能进行比较研究。本文将深入探讨行为特征工程的重要性,详细评估一系列经典模型和量子-经典混合模型,并提出一个名为FD4QC的实用部署架构,旨在将先进的欺诈检测模型集成到实际的运营环境中。
为了对这些方法进行严谨的评估,我们采用了系统化的方法论,涵盖了数据准备、模型选择与实验设计,下文将对此进行详述。
2. 方法论:严谨的模型评估方法
建立一套稳健且透明的评估方法对于获得可信的结论至关重要。本节将详细介绍本次比较分析所使用的数据基础、特征工程流程,以及为构建性能基准而选定的经典与量子算法。
2.1 数据集与行为特征工程
我们的分析基于IBM发布的用于反洗钱(AML)的合成交易数据集,该数据集旨在模拟金融网络中客户与机构之间真实的交易行为和可疑活动。
为了将原始数据转化为富有洞察力的模型输入,我们开发了一套全面的行为特征工程框架。这一过程对于提升模型性能至关重要。我们构建的特征集旨在捕捉发送方和接收方账户的历史行为模式,可分为以下几类:
* 账户角色的统计特征: 分别计算发送方和接收方账户在过去发送和接收交易中的交易金额均值、标准差、最大值和最小值。
* 时间动态: 计算每个账户距离上次交易的时间间隔,并使用指数加权移动平均(EWMA)等方法平滑时间序列模式。
* 分类与上下文特征: 对支付货币和支付方式等分类变量进行独热编码(one-hot encoding),并加入如Same_Bank(同一银行内转账)等上下文标志。
* 行为变化特征: 用于检测账户在交易货币或支付方式上偏离其典型行为模式的指标。
* 成对特征: 捕捉特定发送方-接收方交易历史的统计数据,包括一个创新的Pair_Equilibrium(交易对平衡度)指标,用于衡量两者关系的平衡性。
2.2 经典基线模型
为了提供一个稳固的性能参考基准,我们评估了四种广泛应用的监督学习算法:
* 逻辑回归 (Logistic Regression - LR): 一种用于二元分类的线性模型。
* 决策树 (Decision Tree - DT): 一种基于层级化、轴对齐分割的非线性模型。
* 随机森林 (Random Forest - RF): 一种通过集成多棵决策树来降低方差的集成方法。
* XGBoost (XGB): 一种高效、可扩展的梯度提升决策树实现。
2.3 量子与混合模型
我们探索了三种将量子计算与经典优化技术相结合的量子-经典混合架构。这些算法均使用PennyLane及其与Scikit-learn和PyTorch的集成库进行实现。
量子支持向量机 (Quantum Support Vector Machine - QSVM) QSVM通过使用量子线路来计算核矩阵,从而扩展了经典支持向量机。它将数据点编码为量子态,并在希尔bert空间中计算它们的内积,以此定义核函数。这种方法有潜力揭示经典核函数难以处理的复杂关联。
变分量子分类器 (Variational Quantum Classifier - VQC) VQC是一种混合量子机器学习模型,由三个主要部分组成:首先,一个量子特征图编码器,它使用量子线路将经典输入数据编码为量子态;其次,一个参数化的量子线路(Ansatz),它定义了模型的结构并包含可训练的量子门参数;最后,一个经典的优化算法(如梯度下降),用于迭代更新Ansatz中的参数。
混合量子神经网络 (Hybrid Quantum Neural Network - HQNN) HQNN将一个变分量子线路作为隐藏层集成到一个经典的深度神经网络中。其架构首先由一个经典编码器压缩输入特征,然后由量子层处理这些特征,最后将结果反馈给一个经典分类器进行最终预测。
在明确了所选用的模型后,下一节将展示这些模型在统一数据集上的量化性能对比结果。
3. 性能对比分析:经典模型与量子模型
本节将展示实验的量化结果。所有模型都在一个留出测试集(holdout test set)上进行评估,评估指标包括准确率(Accuracy)、F1分数(F1-measure)、精确率(Precision)、召回率(Recall)和假正例率(False Positive Rate, FPR)。为便于实验,我们使用了经过缩减和欠采样处理的数据集,其中非欺诈样本与欺诈样本的类别比例为9:1。
下表总结了各模型的性能对比结果。
算法 准确率 F1分数 精确率 召回率 假正例率 (FPR)
经典模型
逻辑回归 0.8588 0.1241 0.1634 0.1000 0.0569
决策树 0.9652 0.8374 0.7860 0.8960 0.0271
随机森林 0.9734 0.8695 0.8536 0.8860 0.0169
XGBoost 0.9698 0.8558 0.8190 0.8960 0.0220
量子模型
VQC (1层, 4量子比特) 0.5990 0.2128 0.1324 0.5420 0.3947
VQC (2层, 4量子比特) 0.5024 0.1566 0.0943 0.4620 0.4931
HQNN (1量子层, 4量子比特) 0.9000 0.0000 0.0000 0.0000 0.0000
HQNN (2量子层, 4量子比特) 0.8448 0.0827 0.1012 0.0700 0.0691
QSVC (2量子比特) 0.9272 0.5297 0.7482 0.4100 0.0153
QSVC (4量子比特) 0.9290 0.5372 0.7715 0.4120 0.0136
表1:经典模型与量子-经典混合模型在测试集上的性能指标。
3.1 结果分析
经典基线模型 基于树的集成模型(随机森林和XGBoost)表现出明显的优越性,在所有指标上都取得了出色的平衡。随机森林展现了最佳的综合性能,其准确率高达97.34%,F1分数为86.95%,同时保持了极低的假正例率。在实际运营环境中,低假正例率对于最大限度地减少错误警报至关重要。
量子模型 变分量子模型(VQC和HQNN)的表现存在显著差异。HQNN模型(1量子层)完全未能识别出欺诈类别,其F1分数和召回率均为0.0000,表明其预测严重偏向占多数的非欺诈类别。与此不同,VQC模型展现出较高的召回率(最高达54.20%),成功识别了过半数的欺诈案例,但其精确率极低,导致了非常高的假正例率(最高达49.31%)和较低的F1分数。
相比之下,QSVC是表现最突出的量子模型。4量子比特的配置实现了92.9%的准确率和53.72%的F1分数。值得注意的是,它达到了77.15%的高精确率和1.36%的极低假正例率,与表现最好的经典模型相当。然而,其召回率(41.20%)明显低于经典基线模型,并且其训练和推理时间要长得多,这构成了实际应用中的一个重大挑战。
4. 通往实际部署的路径:FD4QC 服务架构
将理论模型转化为实用、可靠的现实世界系统是技术落地的关键。为了应对在运营环境中部署实验性模型所面临的挑战,我们设计了一个名为FD4QC(Fraud Detection for Quantum Computing)的概念性服务架构。
FD4QC的核心理念是“经典优先,量子增强”(classical-first, quantum-enhanced)。该设计通过使用经过验证的经典模型作为系统的主干来确保运营的稳健性,同时允许以可控的方式逐步集成和测试实验性的量子模型。
该架构的关键特性包括:
* API 设计: 一个无状态的RESTful API,旨在简化与其他系统的集成。
* 模型选择: 一个轻量级的路由器,用于在经典模型和量子模型之间进行选择,从而支持A/B测试。
* 回退机制: 一种透明的回退机制,当量子后端不可用时,请求会自动重新路由到经典的替代模型,从而确保服务的连续性。
* 可审计性: API的响应会明确标记预测结果是由“经典”引擎还是“量子”引擎生成,以确保完全的可追溯性和审计性。
这一实用架构为我们深入探讨实验结果的战略意义及其对未来研究的启示提供了坚实的基础。
5. 讨论:战略意义与未来研究方向
本次实验结果清晰地表明,对于当前的欺诈检测任务而言,由强大的领域特定特征工程驱动的成熟经典集成方法,仍然是实现可靠、高效检测的首选。随机森林和XGBoost的卓越表现说明,精心设计的特征为这些模型提供了足够富有表现力的数据表示,使其能够有效捕捉欺诈模式。
当前量子模型的性能局限主要源于算法成熟度、变分线路训练的固有挑战以及数据集结构未能有效激发量子优势等综合因素。
尽管如此,QSVC模型的表现仍然值得关注。它实现高精确率和低假正例率的能力表明,在某些特定场景下它可能具有独特的应用价值——例如,当误报一个正常交易为欺诈的代价极高,而较低的检出率(召回率)是一个可以接受的权衡时。这一发现为深入研究量子核方法提供了动力。
为提升QML在该领域的应用前景,以下几个研究方向值得探索:
* 高级电路设计: 探索定制化的Ansätze和自适应特征图,以在不引入训练不稳定性的前提下增强模型的表达能力。
* 混合架构: 将量子线路与经典的时间序列特征提取模块(如LSTM)相结合,以更好地利用两种范式的优势。
* 数据编码与特征选择: 利用量子自动编码器等技术进行特征压缩,或采用元启发式方法进行特征选择,从而更好地为量子处理准备高维数据。
这些战略考量与未来方向共同指向了我们对当前量子人工智能在欺诈检测领域应用潜力的最终评估。
6. 结论:量子人工智能在欺诈检测领域的当前定论
本研究的结论明确:在当前的金融欺诈检测领域,由精细特征工程驱动的经典集成模型(如随机森林)在性能和可靠性上仍显著优于新兴的量子算法。目前,量子人工智能的成熟度尚不足以在该高风险应用中提供实际优势,经典方法依然是运营部署的首选。
然而,我们的探索也带来了宝贵的见解。QSVC模型在实现高精确率方面显示出显著潜力,而我们提出的FD4QC概念架构为未来将量子技术集成到金融安全系统中提供了一份务实的路线图。为了充分释放量子计算在金融领域的未来潜力,持续深入地研究量子核方法、先进的混合架构以及复杂的数据编码策略至关重要。
7. 致谢
本项工作得到了FD4CQ(Fraud Detection con Computer Quantistici)项目的支持。该项目由意大利国家复苏与恢复计划(PNRR)资助,隶属于“使命4:教育与研究”–“组成部分2:从研究到商业”–“投资线1.4”,并由欧盟“下一代欧盟”(NextGenerationEU)计划提供资金。该项目是ICSC–Spoke 10“量子计算”的一部分。
8. 参考文献
1. Erik Altman, Jovan Blanuša, Luc Von Niederhäusern, Béni Egressy, Andreea Anghel, and Kubilay Atasu. Realistic synthetic financial transactions for anti-money laundering models. Advances in Neural Information Processing Systems, 36:29851–29874, 2023.
2. Ville Bergholm, Maria Schuld, Christian Gogolin, Josh Izaac, and Nathan Killoran. Pennylane: Automatic differentiation of hybrid quantum-classical computations. arXiv preprint arXiv:1811.04968, 2022.
3. Lukas Bischof, Stefan Teodoropol, Rudolf M Füchslin, and Kurt Stockinger. Hybrid quantum neural networks show strongly reduced need for free parameters in entity matching. Scientific Reports, 15(1):4318, 2025.
4. Béni Egressy, Luc Von Niederhäusern, Jovan Blanuša, Erik Altman, Roger Wattenhofer, and Kubilay Atasu. Provably powerful graph neural networks for directed multigraphs. In Proceedings of the AAAI Conference on Artificial Intelligence, volume 38, pages 11838–11846, 2024.
5. European Central Bank and European Banking Authority. Ecb and eba publish joint report on payment fraud, August 2024.
6. Tobias Haug, Kishor Bharti, and MS Kim. Capacity and quantum geometry of parametrized quantum circuits. PRX Quantum, 2(4):040309, 2021.
7. Martins, Cleber. What percentage of customers leave their bank after an incident of app fraud? Fintech Finance News, April 2025.
8. Luca Pajola, Dongkai Chen, Mauro Conti, and VS Subrahmanian. A novel review helpfulness measure based on the user-review-item paradigm. ACM Transactions on the Web, 17(4):1–31, 2023.
9. Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d’Alché Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 (NeurIPS 2019), pages 8026–8037. Curran Associates, Inc., 2019.
10. Fabian Pedregosa, Gaël Varoquaux, Alexandre Gramfort, Vincent Michel, Bertrand Thirion, Olivier Grisel, Mathieu Blondel, Peter Prettenhofer, Ron Weiss, Vincent Dubourg, et al. Scikit-learn: Machine learning in python. Journal of machine learning research, 12(Oct):2825–2830, 2011.
11. Jonathan Romero, Jonathan P Olson, and Alan Aspuru-Guzik. Quantum autoencoders for efficient compression of quantum data. Quantum Science and Technology, 2(4):045001, 2017.
12. Yuto Takaki, Kosuke Mitarai, Makoto Negoro, Keisuke Fujii, and Masahiro Kitagawa. Learning temporal data with a variational quantum recurrent neural network. Physical Review A, 103(5):052414, 2021.




