新闻网讯(记者团 胡丰林 见习记者 吴子怡)11月5日我校电子信息与通信学院副院长尤新革教授做客第136期“科学研究方法论坛”,畅谈大数据的“昨天”、“今天”和“明天”。
为了介绍大数据的特性,尤新革首先从大数据的背景谈起,进而将大数据与通常意义上的信息做了比较。他表示在信息时代,一件事情发生概率越低越有价值,比如新闻。但大数据时代中,反而是大家都在做的事情价值最高。这就反映了大数据的低价值密度性。同时尤新革指出大数据还具有大量化、多样化、快速化的特性。在他看来,满足以上四种特性的数据集合形成大数据。
在与学生的互动中,尤新革发现有学生对大数据如何用来减少学术造假表示疑惑。对此,尤新革解释说在非大数据时代,查找论文抄袭需要先找到相关专家的论文,进行人工或计算机的小范围比对。“这种方法耗时耗力,而且死板、容易出现疏漏。如今通过大数据对文章进行分析只需要键入关键词。”他比较两种方法后这样说。
为了帮助学生进一步理解,他通过一个例子来说明。“比如说大数据是可以自动将‘我把饭吃了’和‘饭被我吃了’归为同一个意思的。”他解释道,即使文章句式出现变化,但只要关键词相同,句子意思相同,通过大数据分析还是能迅速识别的。“这无疑可以减少查证论文作弊时的疏漏,从而也能尽快实现有效的监督学术诚信。”在他看来,做研究中比成果更重要的是研究者的诚信问题。
在整个讲座中尤新革还谈到了大数据在工业中的广泛应用。“丰田汽车运用大数据处理,减少了80%的设计缺陷,通用电气运用大数据把对用户需求预测的准确率提高到了70%。”他表示不仅是工业,大数据的应用已深入农业、公共安全、医疗、政府管理与决策等社会各个方面。
谈到大数据未来的发展前景时,他用一个愿景表达他对此的乐观态度,“以后我们去餐馆吃饭将不必等候,老板通过大数据分析就已准确预知你要点的菜。”