■ 记者 张雯怡 通讯员 李梦凡
鲲鹏,乃是中国古代传说中的神兽。毛泽东曾挥笔写下:“鲲鹏展翅,九万里,翻动扶摇羊角。” 在当今计算机领域,“鲲鹏” 则有着别样的含义。它是华为计算产业的主力芯片之一,也是 PC(个人电脑)领域的旗舰产品。而 “鲲鹏” 系列芯片的竞争对手正是大名鼎鼎的英特尔和AMD。
鉴于此,在选择中国国际大学生创新大赛(2024)的赛题时,计算机学院博士生王梓骁毫不犹豫地瞄准产业命题赛道,将“鲲鹏 BoostKit 数学库高性能算法优化开发”确定为选题。
近年来,美国对中国科技企业实施芯片“断供”。为了使以“鲲鹏”为代表的“中国芯”振翅高飞,中国科学家们付出了不懈努力。优化算法便是为“中国芯”助力的方法之一,同时也是王梓骁努力的方向,“算法的效率与芯片性能的发挥直接相关,通过对算法的优化能够充分挖掘芯片的性能。借助算法改进,可以减少冗余的数据传输,优化内存的使用,降低芯片的功耗以及热量输出。这一点对于移动设备和数据中心而言尤为重要。”王梓骁说,希望能够通过自身的努力,逐步缩小“中国芯”与先进水平之间的差距。
作为计算机学院的学子,王梓骁十分清楚自己肩上所担负的重任。达梦数据库、鸿蒙操作系统、长江存储、国产CPU等国产化计算机系统技术的奋斗历程及设计案例,对他来说早已熟稔于心,贯穿于两年专业学习的全过程。对计算机学院师生而言,开展与产业核心需求相结合的前沿技术研究是学习、工作的“指南”。“在新生第一课时,我们就明白,作为计算机专业的人,要为信息技术的自主创新奋力拼搏,突破‘卡脖子’难题。”
王梓骁的选择得到了导师张宇教授的支持。“既然选择了参赛,那就没有回头路,必须坚持到最后!我们要做出根植于中国的世界级创新成果!”课题组迅速组建起一支由九名队员组成的参赛队伍,“星算” 团队就此诞生。
虽然首次参赛,但每个队员都信心满满,因为他们此前都积累了与鲲鹏数学库相关的研究经历。更何况,学院坚持“面向系统,软硬协同、生态融合”的全栈式系统能力人才培养理念,培养了一大批包括华为“天才少年”在内的创新型人才。近年来,学子斩获挑战杯金奖、“互联网+”金奖、世界超算大赛总冠军、SAT国际算法竞赛第一名、图计算挑战赛全球总冠军、EDA工业布局布线设计全球冠军等诸多奖项。有了前辈们的经验作为支撑,“星算”团队摩拳擦掌,打算再次刷新纪录。
在高水平科研领域,每一点进步都如同在百米赛跑中争夺毫秒之差,是对极限的一次次挑战。团队深入分析现有数学库算法在支持真实复杂应用场景时的不足之处,很快便推出了自主研发的数学库算法优化技术。然而,他们精心设计的算法却并没有达到预期的效果。
“这太慢了,不行!远达不到我们想要的效果!”王梓骁看着团队自主研发的算法的运行表现,显得格外焦虑。“这已经很快了,性能比现有方法提升了近1.5倍!这个算法有了学长们前几年的积累,在国内来说效率已经是数一数二了!”队员赵英淇觉得还行。“是有一些提高,但我认为仍然没实现计算资源利用率的最大化!以前的成果是起点,是激励我们前进的动力。我们的目标不止于此,我们要超越他们,将算法推向新的高峰。”作为队长,王梓骁认为目标必须远大:“来,我们再试试向量化、数据预取、编译优化,要想尽一切办法让性能逼近理论峰值!”
数学库的优化不同于普通的软件开发,它不仅要求开发者对处理器架构有深入的掌握,还考验着他们的数学能力。距离决赛还有21天,新的“拦路虎”又出现了。如何在不牺牲算法精度的前提下,大幅提升算法的运行速度成为棘手的问题。尝试、再尝试,不眠不休、废寝忘食,在这场与时间赛跑的技术研发中,“星算”团队一刻也不敢松懈。他们敲了超8万行代码、找出2000多个漏洞、优化算法30余次。终于,技术瓶颈再次被成功突破。
10月15日,“星算”团队在上海迎来了最后的巅峰对决。与他们一起站在产业赛道上的,还有来自上海交通大学、哈尔滨工业大学、厦门大学等高校的150支参赛队。他们将共同经历实际交付验证、现场展示评比等环节的比拼,角逐最后的金奖。在王梓骁眼里,这些团队是对手,更是战友,“我们都希望通过这个比赛,发挥敢想、敢创、敢尝试的精神,赋能新质生产力,为国家的创新产业发展贡献力量!”
决赛阶段,“星算”团队紧密结合鲲鹏处理器的特征与鲲鹏 BoostKit 数学库的特性,深入开展性能优化工作,切实有效地解决了实际业务场景中鲲鹏服务器在支持数学库时所面临的技术难题。在确保精度不变的前提下,他们将现有鲲鹏数学库的部分算法性能平均提升了1.76至3.03倍,成功夺得金奖,并获得了命题方华为的高度认可。
“赢了!我们确实做到了!”夺金那一刻,王梓骁内心如潮水般汹涌澎湃,热血在身体中急速涌动,恍惚间,似乎听到了呼啸而来的风。那是无数如他一般的中国青年凝聚而成的青春劲风。在这风中,庞大的“鲲鹏”舒展双翼,勇敢无畏地冲向更为辽阔的苍穹。