电信学子研究成果获国际顶级会议口头报告资格
发布时间:2025.06.18

来源:电信学院 编辑:汪伟颋 浏览次数:

新闻网讯 近日,电信学院移动通信与智能系统实验室信息与通信工程专业博士研究生牛成梅在随机矩阵和随机数值代数理论研究方向取得进展。其以第一作者身份撰写的论文Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton被机器学习顶级会议国际机器学习大会(International Conference on Machine Learning 2025,简称 ICML 2025)接收,并获口头报告资格(投稿论文前1%)。


移动通信与智能系统实验室带头人为邱才明教授IEEE Fellow、电信学院院长邱才明教授,论文指导老师为廖振宇副研究员,其他合作老师包括电信学院凌泽南助理研究员与加州大学伯克利分校 Michael W. Mahoney教授。


随着机器学习与高维数值计算的深度融合,随机数值线性代数(RandNLA)已成为应对大规模科学计算、机器学习和人工智能系统中计算、通信与存储瓶颈的关键技术。其中,随机sketching方法(如随机投影与随机抽样,见图1)在保证精度的前提下对大规模矩阵进行压缩,显著提升了运算效率,被广泛应用于各种科学计算、数值优化、机器学习和人工智能任务中。


随机sktching方法示意图


给定大规模矩阵,传统基于JL引理和子空间嵌入的统计理论往往局限于其sketch矩阵的无偏性和近似性。然而,在大量科学计算和机器学习应用中真正关心的是其逆矩的统计性质。由于矩阵求逆的非线性,原始矩阵的无偏性无法传递至逆矩阵,由此导致逆偏差(inversion bias)问题,直接影响了诸如子抽样牛顿法(Sub-sampled Newton)等随机优化算法的稳定性和精度。随着非渐近随机矩阵理论发展,已有研究精确刻画了高斯和次高斯随机投影方法的逆偏差特性。然而,这些理论结果无法应用于更具工程可行性的随机抽样方法与结构化 sketching技术(如Hadamard变换),该方向仍存在理论空白。


不同 Sketch 尺度下 Newton-LESS 与SSN-ARLev (所提新方法)算法的收敛性与计算复杂度的比较结果


针对这一理论空白,牛成梅提出了一套系统性的逆偏差分析与校正方法,系统刻画并校正随机抽样方法的逆偏差。该工作基于非渐近随机矩阵理论与 RandNLA 高维分析工具,首次给出了逆偏差的非渐进刻画,并据此设计了通用的去偏随机抽样矩阵。该理论适用于包括均匀抽样、杠杆值抽样及结构化投影(如Hadamard变换)在内的主流 sketching 方法,突破了现有结果仅适用于高斯/次高斯投影的限制。此外,这一方法还首次建立问题无关的子抽样牛顿法收敛理论,进一步将逆偏差校正理论应用于子抽样牛顿法中,首次证明去偏的子抽样牛顿迭代法可实现与稠密高斯投影方法近似一致、问题无关的局部收敛速率,进一步完善了对于基于抽样的随机优化方法的理论理解。实验结果显示,所提出的去偏子抽样牛顿法(SSN-ARLev)在保证与SoTA Newton-LESS方法相同的收敛速度的同时,可减小1-2个数量级的计算时间。


学校微博
单周单篇点击量排名