【校三标】赵为之:天下事有难易乎?为之,难者亦易矣
发布时间:2025.05.14

来源:宣传部 编辑:范千 牟梓苓霄 浏览次数:

■ 记者团 牛彤


近日,《人民日报》刊登2023-2024学年度国家奖学金获奖学生代表名录。我校人工智能与自动化学院人工智能专业2021级本科生赵为之,作为本专科生类别中唯一的华科大代表,从全国20余万获奖学子中脱颖而出,荣登该名录(全国本专科生仅100人)。此外,赵为之还是该学年度我校本科生最高荣誉校三好学生标兵称号获得者。


走近赵为之,不难发现他就是离人工智能最近的一批年轻人之一,也是躬耕于人工智能角斗场的普通人之一。为科研笃行不怠,之正道求索无疆。


4CB13B


“搞科研就是我的爱好”


21岁的赵为之没有座右铭,不喜欢拍照,很少参加聚餐,谈及兴趣消遣,他说“搞科研就是我的爱好”。


赵为之跟机器人打交道远比跟人类打交道频繁。


用他熟悉的数据做论据:他每天七点半起床,从宿舍出发,大约二十分钟后,到南一楼底楼的实验室,跟一堆数据和机器相处,在那里一直待到晚上近九点。关于“机器人”的活动,占据了赵为之大部分的时间配额。


不带功利性的目的,赵为之投放在科研上的时间,更多是在为“爱好”买单。科研带给他切实的快乐和满足,扩张知识的边界成为他的一种本能需求。他用搭乐高类比这种心理,“一个小朋友最开始喜欢玩乐高,用乐高搭车,后来他不满足于搭车,想搭出一个机器人,再后来又会想让机器人动起来。”也许这种“不满足”正是他和机器人结缘的关键,此后又督促着他在这条路上走了很远:高中参加机器人大赛,在FTC机器人比赛进入世界锦标赛,大学参与研发的视觉模型准确率达到了国际领先水平,科研论文被国际视觉顶会ECCV2024接收,在校期间连续三年获国家奖学金和校三好学生称号……


C7EF


但赵为之并不沉浸在这种成功中,他志不在此。


“身外之物”,他这样形容那些缀在他名字后面的荣誉。2024年他记忆中的每个节点,都是用科研作为标志性事件。7月1日论文被ECCV接收,10月份完成的机器人路径规划,目前正在进行的科研实习,第二年要准备的一场机器人竞赛……


对“本质”和“原理”有旺盛的好奇心


人工智能与自动化学院的C语言程序设计大赛,是一项“全校出名”的活动,要求学生自主设计C语言代码作为结课展示。当时赵为之和同学做了很大胆的尝试,打破传统程序二维的边界,编写了一个三维交通仿真程序。这个新鲜事物在赵为之的电脑上运行良好,有川流不息的车辆,红绿灯矗立在一条可以自行旋转的道路上。但验收的操作系统和编译器与程序不兼容,没有为赵为之的“交通”放行。程序在验收系统上没能“跑”起来,给赵为之带来了一个不理想的分数。尽管经老师同意后,这个程序最终通过赵为之的电脑向老师呈现,完成了验收,但他心中仍翻涌着一股情绪——好奇。


于是验收结束后,他又回到了机房,在一次次调试中找到了症结所在:在最新的Windows系统上,一个浮点数除以零可以得到正无穷,但在验收的系统上,浮点数除以零会让电脑崩溃。修改了程序里关于浮点数除以零的代码之后,这个充满创新的程序终于有了大展拳脚的土壤,在后来学院举办的C语言程序设计大赛上斩获特等奖。


诸如此类的经历还有很多。赵为之曾经给不少教科书和习题册挑出过错误;学机器人编程,普遍的捷径是在平台上搜索简易教程,赵为之却啃起了英文论文;做机械臂研究不愿生搬公式,而是带着团队成员一点一点推算方程。他怀着一颗想要“搞懂”的心,所以不接受“不求甚解”,坚守着自己一毫不苟的科学。


走一步,再走一步


“意外之喜”和“水到渠成”并非是科研经历的真实构成。大多数时候,赵为之周旋在理想模型和技术现实之间,常常迷茫,时时困惑。


在国家政策层面,人工智能被看做新一轮科技革命和产业变革的重要驱动力量。但在操作层面,由于实验数据稀缺,每一项技术的落地,背后都是日复一日重复性的劳动。赵为之的毕业设计是一个VLA项目,它是一个用于控制机器人的AI模型,通过摄像头获取视觉数据,通过文本获取人类指令,就能输出动作,控制机械臂执行任务。通过这个模型,可以实现人类发出类似“整理碗具”的指令,机械臂就会相应地自动执行。


从人的角度来看,这只是一个简单的肌肉运动。但对于机器人来说,从畅想到落地仍有鸿沟。赵为之训练VLA的方法是模仿学习,即人类遥控机械臂执行多次任务,收集多段数据,通过数据集训练VLA模仿人类遥控数据。


第一次数据收集和模型训练,失败。接受指令之后,机械臂乱动。经过一番检查,赵为之发现是机械臂的出厂设置出了问题,厂家代码在读入和输出时,产生的坐标并不一致,导致机械臂无法按照原定的坐标运动。折腾好久,赵为之采取了一个巧妙的办法,得到了平移旋转矩阵——通过关节角度迫使机械臂延输入坐标y轴移动,再读取输出坐标值。


第二次数据收集和模型训练,失败。由于没有原厂数据,坐标平移旋转后,仍存在2厘米误差。误差再通过指令传输给机械臂,乱动的情况没有得到改善。赵为之又检查了VLA输出,发现它的输出经常卡到上下界。他猜测是原论文中bq99量化的问题,于是将bq99这一步进行了替换。


第三次数据收集和模型训练,仍然失败。在与学长讨论后,赵为之得出了“任务太难”的结论。他将任务更改为“抓取玩偶”,再次收集了100条数据集。


157058

赵为之录制的部分数据集


依旧失败。


在这个经验为稀缺资源的新兴领域,赵为之只好推测是VLA本身的短板,不足以支撑复杂动作的运行。


事情本该到此告一段落。关于人类最前沿的产业,失败是常态中的常态。赵为之手上开始收拾东西,心里却突然想再回放一次数据集。


他当然这样做了,于是发现了真正的问题所在:由于厂家代码编写的某种原因,坐标的时间输出是滞后的。原本厂家的出厂代码难以修正,但得益于赵为之本着记录一切有用数据的原则,录制了未延迟的数据,最后一次尝试,成功了。


输入“整理碗具”的指令,一秒钟后机械臂会缓慢地将一只只碗摞好,支撑它的,是赵为之录制了上十G的数据集,自学了建模、机械制造和3D打印,摸索了好几种修正代码,才有了这矮矮的一摞碗。


5C2A57


一切也许在赵为之的名字里就有隐喻。他注定偏爱实干胜过空谈,心里满是一捧对科学研究的深情,和一腔对人类和人工智能命运的关心。正如他对自己名字的解读:“天下事有难易乎?为之,则难者亦易矣;不为,则易者亦难矣。”


学校微博
单周单篇点击量排名