新闻网讯 2010年6月3号晚七点,电信系副系主任刘文予在“IT明灯”系列讲座第九期上给大家带来了奇妙的“图片描述”之旅。他通过一段段视频,一幅幅图片,向同学们展示了图片描述的相关技术。
处理图片:Google照片不全真实
刘文予教授在讲座开始时给大家看了一些经过处理的图片,比如在图像上去掉一个人或在图片上添加一个杯子。虽然同学们知道那些照片经过了处理,但他们很难在照片上找到一丝处理过的痕迹。教授告诉大家,“Google里的图片并不都是真实的,有些涉及机密的东西它会事先处理掉,所以大家在看图片时不可全信。”这种技术在电影电视中也随处可见。
处理之后的图片缺乏真实,但仍要呈现出“真像”,要做到这般天衣无缝,确实需要一些技术。刘文予教授介绍道,“这其中需要两项关键技术。首先要将图片分成小块,搜索统计特性相同的小块,这就好比在一群人中找到相似的人出来。这依赖于相似性的描述与匹配技术;二是小块的边界处理,这又需要信号处理技术,让小块看上去像一个整体。”
视觉曲率:保持图像不受噪音干扰的良方
“微积分上定义的经典曲率有比较多的局限,比如说噪声会引起数字图像的失真。要避免这些缺点,于是人们定义出了新的曲率即视觉曲率。”刘文予这样介绍视觉曲率,“相比经典曲率,视觉曲率具有多尺度特性,即从多角度多方位描述一个物体。比如要描述一个人除了描述他的身形还要介绍他的外貌表情,这样多尺度地描述一个人才更形象具体。视觉曲率,恰恰满足了这方面的需求。同时视觉曲率适用于任何曲线特别是数字曲线,而且还能够在有噪声的情况下保持稳定。”
视觉曲率在生活中有很多应用。对于一个受噪声干扰的五角星,它的轮廓已比较模糊,但借助于视觉曲率就可以还原为原来完整的五角星。
骨架剪枝:“匹配跟踪识别”的完美辅佐
骨架,即是一个物体的拓扑结构。骨架之于物,就好比骨骼之于人。骨架剪枝,是将物体的骨架用曲线描述出来。利用骨架曲线间的相似性,可以达到图像匹配的作用。比方说一匹马,它可以有许多姿势,如站立式、俯首式、长啸式,不同的姿势对应着不同的骨架。当向计算机输入马奔跑时的骨架时,计算机如何判断出这个骨架是马而不是其他动物呢?这其中的原理就在于计算机会根据已有的那三个骨架与所给骨架间的相似度进行判断。如果相似度达到一定的要求,即认为这幅骨架描述的是马。
“骨架描述”的应用也有很多。如视频跟踪,当警方要跟踪某个罪犯时,可以将他的几幅图像传输到摄像头上,摄像头会根据这些图片表现出的骨架结构始终跟踪这个人,这大大方便了警方破案的速度;计算机也可以通过手的骨架识别手势,如果要把某个文件删除,则只需朝计算机做一个手势即可;同时它也可用于动态人脸识别技术,在北京奥运期间这项技术就大大发挥了它的作用。