新闻网讯(通讯员 王英杰)3月,机械学院科研团队与校友的合作论文“Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection(从单张图像中提取正常模式)”被计算机视觉与模式识别领域国际顶级学术会议CVPR 2025(IEEE/CVF Conference on Computer Vision and Pattern Recognition)主会接收。论文作者为清华大学精密仪器系的博士生、学院2023届本科测控技术与仪器专业校友罗威、2022届本科测控技术与仪器专业校友姚海明,2020级博士生曹云康、2023级博士生程育奇及导师沈卫明院士。学院余文勇副教授为通讯作者。

工业异常检测的常规方法是将测试图像与训练集里学习到的正常模式进行比较,但面对外观和位置变化时容易产生对不齐问题,从而导致误检或漏检。注意到在异常样本中,有价值的正常信息仍然存在,并且与异常更融合。受此启发,论文提出了一种全新的方法INP-Former。该方法不依赖于训练集的正态性,而是直接根据一张测试图像就能提取内在正态原型(INP),并利用这些INPs指导图像重建,通过重建误差实现异常检测。为此,论文设计了INP提取器,提出了INP相干损失,以确保INP能够忠实地表示测试图像的正态性,并设计软挖掘损失来处理训练过程中难以优化的样本。该方法在异常检测国际权威数据集MVTec-AD、VisA和Real-IAD的单类、多类和小样本异常检测任务,以及零样本任务中实现了较先进的性能,有望成为一种通用的异常解决方案。
据悉,CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)是人工智能领域中聚焦计算机视觉与模式识别方向的国际顶级会议,将于6月11日在美国田纳西州纳什维尔市举办。会议共收到13008篇有效投稿,接收论文2878篇,录用率为22.1%。