摘要
信道状态信息(CSI)预测是通过提供及时的下行链路(DL)CSI来确保大规模多输入多输出(mMIMO)系统可靠高效运行的一种有效策略。尽管基于深度学习的方法已超越传统的模型驱动和统计方法,但它们在对实际非高斯噪声的鲁棒性、跨多样化信道条件的泛化性以及计算效率方面仍存在局限。本文提出了一种名为CSI-4CAST的混合深度学习架构,该架构集成了四个核心组件:卷积神经网络残差、自适应校正层、ShuffleNet模块和Transformer,旨在高效地捕捉CSI预测中的局部和长程依赖关系。为实现严格评估,本研究进一步构建了一个全面的基准测试CSI-RRG(覆盖常规、鲁棒性和泛化性测试),包含了超过30万个样本,涵盖了时分双工(TDD)和频分双工(FDD)系统下的3060个真实场景。该数据集跨越多种信道模型、广泛的延迟扩展和用户速度范围,以及多样的噪声类型和强度。实验结果表明,CSI-4CAST在TDD场景中以绝对优势胜出(在88.9%的场景中优于基准模型),在更具挑战性的FDD场景中也表现最佳(在43.8%的场景中排名第一),同时与最强的基准模型LLM4CP相比,其计算成本在TDD和FDD模式下分别降低了5倍和3倍。该工作为推动鲁棒、高效的CSI预测研究做出了重要贡献。
关键词 CSI预测,mMIMO系统,时间序列预测,无线通信中的深度学习,计算效率,鲁棒性,泛化性
--------------------------------------------------------------------------------
1. 引言
1.1 背景
大规模多输入多输出(mMIMO)技术已成为第五代(5G)无线通信网络的核心。通过在基站(BS)部署大型天线阵列,并采用定向波束赋形、高效预编码和自适应功率分配等先进技术,mMIMO显著提升了频谱效率和能量效率。然而,要充分发挥mMIMO的优势,一个关键前提是在基站处获得精确且实时的下行链路(DL)信道状态信息(CSI)。
1.2 信道老化挑战
在实际应用中,获取CSI面临着“信道老化”这一严峻挑战。该问题源于无线系统中固有的传输、估计和反馈延迟。用户的移动性、多径传播效应以及信道噪声进一步加剧了信道状态的快速变化。因此,当基站获取CSI时,它往往已经过时,无法准确反映真实的信道状况,从而影响预编码和功率分配等关键操作的性能。
1.3 作为解决方案的CSI预测
CSI预测作为一种前瞻性策略,能够有效缓解信道老化问题。其核心思想是基于历史观测来预测未来的CSI。根据双工模式的不同,CSI预测任务可分为两类:
- 带内预测(TDD系统):在时分双工(TDD)系统中,上行(UL)和下行(DL)链路在同一频段上交替传输。CSI预测利用历史的上行或下行CSI来预测未来的上行或下行CSI。
- 带间预测(FDD系统):在频分双工(FDD)系统中,上行和下行链路使用不同的频段。CSI预测利用历史的上行CSI来直接预测未来的下行CSI,这是一个更具挑战性的跨频段预测任务。
1.4 现有方法的局限性
传统的CSI预测方法主要分为模型驱动和统计两大类。自回归(AR)模型和卡尔曼滤波器等模型驱动方法虽然在特定条件下有效,但它们对模型失配和非高斯噪声敏感,且参数估计的开销较大。
近年来,基于深度学习的方法取得了显著进展,但仍面临三大核心挑战:
- 噪声鲁棒性不足:实际无线信道中存在多种非高斯噪声,如相位噪声、突发噪声和丢包噪声。现有研究大多在理想的高斯白噪声假设下进行评估,对这些真实噪声的鲁棒性研究尚不充分。
- 泛化能力有限:深度学习模型往往难以泛化到训练数据中未见过的场景。当信道条件(如用户速度、信道模型)发生分布变化时,模型性能会急剧下降。
- 计算成本高昂:一些性能领先的方法(如LLM4CP)依赖于大型预训练语言模型,这导致其对硬件资源的需求过高,难以在每个基站上进行实际部署。
1.5 本文贡献
为应对上述挑战,本文做出了以下三项核心贡献:
- CSI-4CAST模型:我们提出了一种新颖的深度学习架构,它巧妙地集成了卷积神经网络、自适应校正层、ShuffleNet模块和Transformer编码器,显著提升了CSI预测的准确性与效率权衡。实验结果表明,CSI-4CAST在TDD模式下88.9%的测试场景中均取得了最低的NMSE,同时与次优模型LLM4CP相比,浮点运算次数(FLOPs)降低了约5倍。在更具挑战性的FDD模式下,CSI-4CAST在43.8%的场景中领先——在所有模型中排名最高——并将FLOPs减少了3倍以上。
- 综合评估套件 (CSI-RRG):我们构建并发布了一个大规模、高真实的基准数据集,专为CSI预测模型的严格训练与评估而设计。该基准覆盖了TDD和FDD系统下的多种信道条件和噪声类型。
- 可复现性与影响力:我们公开发布了CSI-RRG基准和相应的评估协议,旨在为该领域的研究提供一个标准化的比较平台,从而促进未来工作的进展。
1.6 论文结构
本文的后续章节组织如下:第二节对CSI预测问题进行形式化定义。第三节详细介绍CSI-4CAST模型架构。第四节描述实验设置。第五节展示并分析性能评估结果。最后,第六节对全文进行总结。
2. 问题定义
本节旨在从数学上形式化定义在MIMO-OFDM系统中的下行链路CSI预测问题,并阐明信道老化效应如何影响TDD和FDD系统中的CSI获取流程。
2.1 系统模型与CSI表示
本研究采用一个MIMO-OFDM系统,其中基站(BS)配备了一个双极化均匀平面阵列(UPA),用户设备(UE)则配备了单根全向接收天线。OFDM将传输带宽划分为 N_{sc} 个正交子载波。
根据既有模型,在时间 t 的CSI可以表示为一个复数张量 H_t,其定义如下: H_t \in \mathbb{C}^{N_{tr} \times N_{re} \times N_{sc}} \quad (1) 该张量的维度分别对应于发射天线数 (N_{tr})、接收天线数 (N_{re}) 和子载波数 (N_{sc})。张量中的每个复数值元素代表了特定收发天线对在特定子载波上的信道系数,其幅值反映了路径增益(衰减),相位则反映了传播引起的相移。
2.2 信道老化问题
信道老化问题的根源在于处理延迟,如图1所示。当基站进行下行链路数据传输时,其所依赖的CSI已经因估计、处理和反馈等环节的延迟而变得过时。
- TDD系统:基站可以利用信道互易性,通过上行链路导频来估计下行信道。然而,从上行导频传输到下一次下行数据传输之间存在调度延迟,这可能导致估计出的CSI失效。
- FDD系统:由于上、下行链路工作在不同频段,信道互易性不成立。UE需要根据下行导频估计DL CSI,然后通过上行链路将其反馈给BS。这个反馈过程引入的延迟同样会导致CSI过时。
2.3 CSI预测框架
CSI预测通过基于历史观测来预测未来的DL CSI,从而有效缓解信道老化问题。如图2和图3所示,该框架在不同双工模式下有不同的应用:
- TDD带内预测:利用历史的上行/下行CSI序列来预测未来的上行/下行CSI。
- FDD带间预测:利用历史的上行CSI序列直接预测未来的下行CSI,从而避免了UE的反馈开销。
我们可以将CSI预测任务统一形式化为学习一个映射函数 f_\Omega。该函数将一个长度为 |T| 的历史CSI序列 H^T = {H_{t-|T|+1}, H_{t-|T|+2}, \ldots, H_t} \quad (2) 映射到一个长度为 |P| 的未来CSI序列 \hat{H}^P = f_\Omega(H^T) \quad (3) 其中,P = \{t+1, \ldots, t+|P|\} 是预测时域,\hat{H}^P 是预测的未来DL CSI。
在更现实的场景中,输入是受噪声影响的CSI观测值 \tilde{H}_t = H_t + E_t,其中 E_t 是加性噪声。因此,预测模型实际学习的是以下映射: \tilde{H}^T = {\tilde{H}_{t-|T|+1}, \ldots, \tilde{H}t} \quad (4)\hat{H}^P = f\Omega(\tilde{H}^T) \quad (5)
本研究旨在提出一种新颖的深度学习模型,以有效学习这一映射函数 f_\Omega。
3. 方法论
本节将详细阐述我们提出的CSI-4CAST深度学习架构。该模型的学习过程旨在最小化训练集 D_{\text{train}} 上预测CSI与真实CSI之间的归一化均方误差(NMSE)。优化目标定义如下: \min_\Omega \mathbb{E}{(\tilde{H}^T_i, H^P_i) \sim D{\text{train}}} \left[ \mathcal{L}(\hat{H}^P_i, H^P_i) \right] \quad \text{s.t.} \quad \hat{H}^P_i = f_\Omega(\tilde{H}^T_i) \quad (6) 其中,损失函数 \mathcal{L}(\cdot) 采用NMSE,其计算方式为: \text{NMSE}(\hat{H}^P, H^P) = \frac{\sum_{t \in P} |\hat{H}_t - H_t|F^2}{\sum{t \in P} |H_t|_F^2} \quad (7)
3.1 CSI-4CAST架构概览
图4展示了CSI-4CAST的整体架构。该架构集成了四个关键组件——Convolutional neural networks (CNN), Adaptive Correction Layers (ACL), ShuffleNet Blocks, and Transformer encoders——以实现高效的特征提取和鲁棒的预测性能。
3.2 架构组件详解
A. 逐天线建模以提升可扩展性与效率
为提升模型的可扩展性和计算效率,我们采用逐个收发天线对独立建模的策略。对于单个天线对,模型的输入是一个复数CSI序列: X = \tilde{H}^T_m \in \mathbb{C}^{|T| \times N_{sc}} \quad (8) 为适配神经网络的实数输入要求,我们将其实部和虚部堆叠起来: X_r = [\text{Re}(X), \text{Im}(X)] \in \mathbb{R}^{2 \times |T| \times N_{sc}} \quad (9)
B. 基于CNN的残差表示
输入数据 X_r 首先通过一个CNN模块。该模块通过捕捉时间和频率上的局部相关性来提取结构化特征。同时,CNN固有的平滑特性有助于抑制噪声,从而生成一个经过提炼的残差表示 X_{CNN}。
C. 利用延迟域表示挖掘多径模式
为了利用信道在延迟域的稀疏和稳定特性,我们将CSI从频域转换到延迟域。这一转换通过逆离散傅里叶变换(IDFT)实现: X_d^C = X_f^C F_d^\dagger \in \mathbb{C}^{|T| \times N_{sc}} \quad (10) 其中,X_f^C 是从 X_{CNN} 转换得到的复数频域表示,F_d 是DFT矩阵。转换后得到的延迟域表示 X_d 能够更清晰地揭示多径传播模式。
D. 用于捕捉潜在结构的自适应校正层 (ACL)
ACL作为一种自适应校准机制,通过可学习的残差映射来动态修正时域和子载波/延迟域的依赖关系。其数学形式如下: X_{\text{ACL1}}[:, k] = \text{MLP}1(X[:, k]) \oplus X[:, k]X{\text{ACL2}}[t, :] = \text{MLP}2(X{\text{ACL1}}[t, :]) \oplus X_{\text{ACL1}}[t, :] \quad (11) 其中,MLP是多层感知机,⊕ 代表逐元素操作,该操作具体是加法还是乘法被视为一个可调的超参数,使模型能够灵活地调制依赖关系。在TDD系统中,ACL仅沿时间维度应用;而在FDD系统中,由于需要进行跨频段预测,ACL会同时在时间和子载波/延迟域上应用。
E. 用于高效特征提取的ShuffleNet模块
为在特征表征的丰富性和计算效率之间取得平衡,我们引入了ShuffleNet模块。该模块集成了一系列轻量级操作,包括逐点卷积(PW)、信道重排(CS)和逐深度卷积(DW)。此外,还引入了Squeeze-and-Excitation(SE)模块来动态地调整各特征通道的权重。整个过程可表示为: X_{FE} = \text{PW}(\text{DW}(\text{CS}(\text{PW}(X_\rho)))) \quad (12a) X_{SE} = \text{SE}(X_{FE}) \quad (12b) X_{SB} = X_{SE} \odot X_{FE} \quad (12c) 最终,频域和延迟域的特征被融合,生成统一的特征表示 X_{SB}。
F. 位置嵌入与Transformer编码器
为了建模CSI序列中的长程时间依赖关系,我们采用了Transformer编码器。由于Transformer本身不具备序列顺序感知能力,我们首先引入了位置嵌入(PE): X_{PE}(u, v) = \begin{cases} \sin(v / |T|^{u/\gamma}), & u = 0, 2, \ldots \ \cos(v / |T|^{(u-1)/\gamma}), & u = 1, 3, \ldots \end{cases} \quad (13) 同时,通过1x1卷积将特征 X_{SB} 投影到Transformer的潜在空间,得到令牌嵌入(TE): X_{TE} = \text{Conv1d}(X_{SB}) \in \mathbb{R}^{|T| \times \gamma} \quad (14a) 将位置嵌入与令牌嵌入相加后,送入Transformer层,得到最终的序列表示: X_{TF} = \text{Transformer}(X_{TE} + X_{PE}) \quad (14b)
G. 预测模块
最后的预测模块由两个MLP组成。第一个MLP将Transformer的输出从潜在维度映射回原始的子载波维度,第二个MLP则将历史时间步投影到未来的预测时间步,从而生成最终的预测CSI序列。
通过上述精心设计的组件,CSI-4CAST能够高效、鲁棒地完成CSI预测任务。
4. 实验设置
本节将详细介绍用于评估CSI-4CAST模型性能的实验配置,包括数据生成、基准模型和评估指标,为后续的性能评估提供坚实基础。
4.1 数据集与CSI-RRG基准
A. 数据生成与系统配置
我们使用Sionna库生成时变CSI。系统配置参数总结在表I中。 表I: 系统配置 | 参数 | 值 | | :--- | :--- | | 基站天线 | 双极化 [4,4] UPA | | 用户设备天线 | 单根全向天线 | | 载波频率 | 2.4 GHz | | 子载波数 (UL/DL) | 300 (UL) / 300 (DL) | | 子载波间隔 | 30 kHz |
我们考虑了一系列广泛的场景,每个场景由用户速度 (v_{ue})、延迟扩展 (\sigma_\tau)、信道模型 (CM)、噪声类型 (NT) 和噪声强度 (ND) 的组合定义: S = {[v_{ue}, \sigma_\tau, \text{CM}, \text{NT}, \text{ND}] \mid \ldots} \quad (15)
B. 训练集
训练数据集的配置如表II所示。 表II: 训练数据集配置 | 参数 | 值 | | :--- | :--- | | 信道模型 | CDL-A, CDL-C, CDL-D | | 延迟扩展 | 30, 100, 300 ns | | 用户速度 | 1, 10, 30 m/s | | 噪声类型 | AWGN | | 信噪比 (SNR) | 在 [0, 25] dB 范围内均匀分布 |
C. 测试套件
我们构建了三个测试集(见表III)来全面评估模型性能。
- Regular:该测试集用于评估模型的分布内性能。其配置与训练集相同,但SNR取值为离散的 [0, 5, 10, 15, 20, 25] dB。
- Robustness:该测试集用于评估模型在三种真实非高斯噪声下的鲁棒性,包括相位噪声、突发噪声和丢包噪声。
- Generalization:该测试集通过扩展信道模型、延迟扩展和用户速度的范围来评估模型的泛化能力。其中包含了训练范围内未见过的值(插值场景)和超出训练范围的值(外推场景)。
4.2 基准模型
我们将CSI-4CAST与以下基准模型进行比较:
LLM4CP: 一个基于大型语言模型(LLM)的先进CSI预测器。STEMGNN: 一个集成了图神经网络(GNN)的深度学习架构。RNN: 一个经典的循环神经网络基准。CNN: 一个利用CSI张量与图像结构相似性的卷积基准。No Prediction (NP): 一个简单的基准,它将最后一个观测到的CSI作为未来所有时间步的预测值。
4.3 训练与评估
训练配置
我们使用Optuna框架进行超参数优化。每个模型的优化过程在1到3块NVIDIA H200 GPU上并行运行,时长最多为30小时。评估标准综合考虑了验证集上的NMSE和模型的浮点运算次数(FLOPs)。我们通过帕累托前沿来选择在准确性和效率之间达到最佳权衡的最终模型。
评估指标
我们采用以下指标来全面评估模型性能:
- 归一化均方误差 (NMSE): 如公式(7)所定义,直接衡量预测的数值准确性。
- 频谱效率 (SE): 如附录E中的公式(35)所定义,量化预测CSI在实际系统中的数据传输速率表现。
- 排名得分 (Rank Score) 与排名第一百分比 (Percentage of Rank 1): 由于不同场景的预测难度差异巨大,直接平均NMSE可能会产生偏差。因此,我们引入基于排名的指标来评估模型在各类场景中的相对表现。计算方式如下: \text{rank}(\pi, s) \in {1, \ldots, |\Pi|} \quad (16) \text{MeanRank}(\pi, S') = \frac{1}{|S'|} \sum_{s \in S'} \text{rank}(\pi, s) \quad (17) \text{RankScore}(\pi, S') = |\Pi| - \text{MeanRank}(\pi, S') \quad (18) \text{Prank1}(\pi, S') = \frac{1}{|S'|} \sum_{s \in S'} \mathbf{1}{\text{rank}(\pi, s) = 1} \quad (19)
- 效率得分 (Efficiency Score): 用于量化模型在FLOPs、参数量和推理时间方面的效率。其定义为: \text{EffScore}(\pi, c) = 1 - \frac{c(\pi)}{\max_{\pi \in \Pi} c(\pi)} \quad (20)
这些指标共同构成了一个全面的评估体系,为接下来的性能分析奠定了基础。
5. 性能评估
本节将全面展示和分析CSI-4CAST与各基准模型在CSI-RRG基准上的实验结果。我们的分析将分别针对TDD和FDD模式,并围绕三个核心维度展开:总体排序性能、在不同信道因素影响下的NMSE表现,以及最终的准确性-效率综合权衡。
5.1 基于排序的总体评估
TDD系统性能
如图5所示,在TDD模式下,CSI-4CAST在Regular、Robustness和Generalization三个测试集上的平均排名(MeanRank)和排名第一的百分比(Prank1)均显著优于所有基准模型。在Regular测试中,其Prank1高达88.9%。与次优模型LLM4CP相比,CSI-4CAST在三个测试集上的Prank1优势分别达到了83.3%、54.5%和33.3%,展现了其在各种条件下的领先地位。
FDD系统性能
如图6所示,在FDD模式下,CSI-4CAST在Regular和Robustness场景中同样保持领先。然而,在Generalization场景中,所有模型的性能都出现了显著下降。这表明FDD的带间预测任务本身难度更高,其泛化能力是当前所有模型共同面临的一大挑战。
5.2 基于NMSE的详细分析
A. 不同AWGN信噪比下的性能
图7展示了模型在不同AWGN信噪比(SNR)水平下的NMSE表现。在TDD和FDD两种模式下,CSI-4CAST在所有SNR点上均实现了最低的NMSE,显示出其强大的噪声鲁棒性。同时,可以观察到FDD模式下的整体NMSE显著高于TDD模式,这再次证实了FDD带间预测的内在难度。
B. 不同用户速度下的性能
图8评估了模型在不同用户速度下的NMSE。正如预期的那样,随着用户速度的增加,信道变化加快,所有模型的NMSE都随之上升。CSI-4CAST在所有速度点上均表现出色。值得注意的是,在训练范围之外的外推区域(速度高于30 m/s),模型性能下降更为明显。比较两种模式,TDD模式对速度变化的敏感度更高,其NMSE随速度增加的幅度远大于FDD模式。例如,对于CSI-4CAST,在用户速度从1 m/s增加到45 m/s时,TDD模式下的NMSE增加了超过10倍,而FDD模式下的增幅不到3倍,这凸显了TDD预测对时间相关性的更强依赖。
C. 不同延迟扩展下的性能
表IV展示了模型在不同延迟扩展值上的NMSE表现。在TDD模式下,CSI-4CAST在训练中见过的延迟扩展上表现最优。然而,在未见过的延迟扩展值(特别是400 ns)上,所有模型的性能均出现下降,凸显了对分布外场景泛化的挑战。这种性能下降在FDD模式下更为严重,在400 ns时,CSI-4CAST、LLM4CP和RNN等领先模型的NMSE增加了超过5倍,这主要是因为更大的延迟扩展降低了频域相关性,使得跨频段预测变得异常困难。
表IV: 不同延迟扩展下的NMSE | 模型 | Regular | Generalization | | :--- | :--- | :--- | | | 30 ns | 100 ns | 300 ns | 50 ns | 200 ns | 400 ns | | TDD | | | | | | | | NP | 2.246 | 1.714 | 1.526 | 1.891 | 1.499 | 1.466 | | CNN | 0.261 | 0.211 | 0.174 | 0.230 | 0.173 | <u>0.172</u> | | STEMGNN | 0.253 | 0.230 | 0.212 | 0.222 | 0.207 | 0.214 | | RNN | <u>0.191</u> | 0.168 | 0.156 | 0.176 | 0.164 | 0.282 | | LLM4CP | 0.195 | <u>0.145</u> | <u>0.103</u> | <u>0.163</u> | 0.110 | 0.141 | | CSI-4CAST | 0.176 | 0.125 | 0.084 | 0.148 | <u>0.119</u> | 0.174 | | FDD | | | | | | | | NP | 2.798 | 2.920 | 2.488 | 3.045 | 2.312 | 2.025 | | CNN | 0.631 | 0.800 | 0.626 | 0.744 | 0.797 | <u>0.994</u> | | STEMGNN | 0.493 | 0.597 | 0.523 | 0.562 | <u>0.818</u> | 0.894 | | RNN | 0.301 | 0.318 | 0.255 | 0.425 | 0.930 | 1.330 | | LLM4CP | 0.334 | 0.467 | 0.184 | 0.557 | 1.003 | 1.421 | | CSI-4CAST | <u>0.316</u> | <u>0.342</u> | <u>0.190</u> | <u>0.495</u> | 0.976 | 1.417 |
注:粗体表示最优值,下划线表示次优值。
D. 不同信道模型下的性能
表V对比了模型在非视距(NLOS)信道(CDL-A/B/C)和视距(LOS)信道(CDL-D/E)下的性能差异。结果清晰地表明,NLOS场景的预测难度远高于LOS场景,其NMSE值通常高出一个数量级。CSI-4CAST在绝大多数信道模型中都取得了最优或次优的成绩。特别值得关注的是,在FDD模式的CDL-B模型(一个未见过的NLOS模型)上,所有模型的泛化能力都面临严峻挑战,NMSE急剧增加,说明对复杂且未知的NLOS环境进行泛化是当前的一大瓶颈。
表V: 不同信道模型下的NMSE | 模型 | Regular | Generalization | | :--- | :--- | :--- | | | CDL-A | CDL-C | CDL-D | CDL-B | CDL-E | | TDD | | | | | | | NP | 2.167 | 1.948 | 1.372 | 1.902 | 1.353 | | CNN | 0.246 | 0.335 | 0.065 | 0.405 | 0.074 | | STEMGNN | 0.283 | 0.364 | 0.049 | 0.453 | 0.058 | | RNN | 0.207 | 0.263 | 0.044 | 0.394 | 0.057 | | LLM4CP | <u>0.168</u> | <u>0.245</u> | <u>0.031</u> | 0.349 | <u>0.043</u> | | CSI-4CAST | 0.156 | 0.207 | 0.022 | <u>0.376</u> | 0.036 | | FDD | | | | | | | NP | 3.857 | 2.935 | 1.415 | 3.029 | 1.419 | | CNN | 0.903 | 0.925 | 0.230 | 1.091 | 0.278 | | STEMGNN | 0.677 | 0.855 | 0.081 | <u>1.107</u> | 0.106 | | RNN | 0.367 | 0.443 | 0.063 | 1.190 | 0.091 | | LLM4CP | 0.498 | <u>0.431</u> | <u>0.059</u> | 1.268 | 0.106 | | CSI-4CAST | <u>0.385</u> | 0.410 | 0.052 | 1.308 | <u>0.092</u> |
注:粗体表示最优值,下划线表示次优值。
5.3 鲁棒性分析
图9评估了模型在相位噪声、突发噪声和丢包噪声这三种真实噪声下的NMSE表现。结果显示,CSI-4CAST在所有噪声类型和强度下均表现出最强的鲁棒性,始终维持最低的NMSE。
我们进一步在图10中比较了CSI-4CAST在相同SNR水平下对相位噪声和突发噪声的响应差异。尽管SNR相同,但结构突兀、能量集中的突发噪声比平滑的相位噪声造成了更大的性能下降。这揭示了一个重要洞见:噪声的结构特征对其对预测性能的影响,甚至比其能量水平更为关键。
5.4 准确性与效率权衡
图11的雷达图综合评估了各模型在准确性(NMSE-rank, SE-rank)和效率(FLOPs, 参数量, 推理时间)方面的表现。
- TDD模式:CSI-4CAST在所有评估维度上均表现出色,其多边形面积远大于其他模型,实现了最佳的准确性-效率权衡。与性能最接近的LLM4CP相比,CSI-4CAST的FLOPs减少了约5倍,参数量减少了约7倍,展现了极高的计算效率。
- FDD模式:CSI-4CAST在Regular和Robustness测试中依然领先,但在Generalization上与其他顶尖模型表现接近,再次凸显了FDD泛化任务的艰巨性。在效率方面,CSI-4CAST的FLOPs约为LLM4CP的1/3,参数量约为其1/2,依然保持着显著优势。
综合来看,CSI-4CAST在实现卓越预测性能的同时,也保持了轻量级的计算开销,为实际部署提供了可行的解决方案。
6. 结论
本研究提出了一种名为CSI-4CAST的轻量级混合深度学习模型,并构建了一个大规模、高真实的CSI-RRG基准,用于对CSI预测模型进行全面而严格的评估。
我们的实验揭示了CSI-4CAST在TDD和FDD模式下均展现出超越现有基准模型的预测精度和计算效率,具体表现为:在TDD和FDD模式下,分别在88.9%和43.8%的场景中取得了最低NMSE,同时与最强竞品相比,FLOPs分别降低了5倍和3倍。详细的场景分析提供了关键洞见:用户速度和SNR对性能的影响是平滑且可预测的;然而,信道模型(NLOS场景的NMSE比LOS场景高出10倍)和分布外的延迟扩展(在400 ns时,TDD和FDD的性能分别下降50%和超过500%)则带来了巨大的泛化挑战。FDD的带间预测任务本质上更为困难,所有被评估的模型在该模式下都表现出泛化能力不足的普遍问题。鲁棒性分析进一步表明,噪声的结构(如突兀的突发噪声)比其能量水平(SNR)对模型性能的影响更大,相比平滑的相位噪声,突发噪声导致了更显著的性能下降。
尽管CSI-4CAST取得了优异的性能,但当前模型在应对信道条件分布变化方面仍存在局限。未来的研究可以探索自适应和主动学习策略,以检测分布变化并实时更新模型,从而实现更可靠、能自我持续优化的CSI预测系统,为下一代无线通信网络的发展铺平道路。
致谢
本研究部分得到了美国国家科学基金会(NSF)奖项2112533的支持。
参考文献
[此处根据源文本中的引用列表生成参考文献]


