涂子沛:万众创新的大数据时代
发布时间:2015.04.17

来源:记者团 编辑:李蓓 见习编辑 周珣 浏览次数:

   新闻网讯(记者团 杨映瑜)4月16日晚7点 ,机械学院报告厅座无虚席,许多同学甚至席地而坐。是什么讲座令大家翘首以盼?正是阿里巴巴副总裁涂子沛主讲的第147期科学研究方法论坛讲座——万众创新:寻找时代的数据英雄。


   会议开始,由计算机学院党支部书记李军致辞,他首先代表学校向涂子沛校友表示热烈欢迎。在此之前,李军书记阅读了涂子沛先生的《大数据》、《数据之巅》两本书籍,他认为书中的内容不仅仅局限于数据更上升到了辩证法的高度,涂子沛先生作为华中科技大学计算机系的优秀校友及阿里巴巴副总裁,值得同学们学习。


数据与价值


   涂子沛先生回忆起二十年前的学生生涯:“当年华中大还被称为华工,我仍然想念曾经和女朋友一起约会的小树林。”他的幽默赢得了同学们的阵阵笑声和掌声。


   “作为一个程序员,仅仅会写代码是不够的,我们还要关注这个世界。”涂子沛说,“自今年两会提出‘互联网+’的概念后,我认为创新更需要被重视,所以我倡导‘万众创新’这个概念。”


   他以一个看似与数据无关的事件为案例:《太阳哨兵报》获得2013年普利策奖。2011年弗洲警察开快车致人死亡的新闻引起关注,一位女记者通过查阅历年100万条警车过收费站的记录,发现有5100宗警车超速的记录。她的发现引起了社会各界的强烈反响。一年后,这位女记者再次查阅数据,由于此前披露了警车的违法行为,她发现超速个案下降幅度达到84%。


   涂子沛先生接下来提到交通拥堵问题,他认为只有改革红绿灯系统,创造更加智能的系统才是治本之策。阿里巴巴天池竞赛提供27万奖金,激励一万多人为贵阳市提供解决交通拥堵的解决方案,这正是所谓的“万众创新”。


   在商业领域,阿里巴巴最初以电商发家,然而通过数据收集可以进而分析发放贷款的可能性。因此阿里巴巴于2010年成立阿里小贷,从电商延伸到互联网金融,阿里巴巴完成了华丽的转型。


   “一切业务数据化,一切数据业务化,让所有的数据产生商业价值。”涂子沛引用马云的话指出数据的重要性。正是由于重视数据,阿里巴巴更能比其他企业发现一些细节之处——例如2012年6月欧洲杯期间女性成交量上升了10%,产生了“男人一看球,女人就网购”的有趣现象。究其原因,他说道:“男士看球的时候,就冷落了女性,女性需要通过购物来排解寂寞情绪。”而阿里巴巴需要做的则是:在球赛开始之前,先将广告发送到女性群体之中。


   沃尔玛发现啤酒和尿布放在一起,销售量可以双赢;亚马逊则尝试下单之前就先发货的策略。“科学的本质即是量化,它们都是通过数据分析并且进行量化,从而发现了消费者的喜好与习惯。”徐子沛说。

涂子沛先生也指出算法和数据并不是万能的。他提到亚马逊曾发生过一本书卖到100万美元的奇闻。《大数据》和《大数据时代》两本书处于竞争,程序员按照通过比对方多卖1毛钱的算法计算价格从而导致不断涨价,最终涨到100万美元。


   “我们现在每天都会收到各种信息垃圾——如果我们真正进入到大数据时代,是不会出现信息垃圾的,我们仍然出于数据时代的初期。”


软件定义世界,数据驱动未来


   美国南北战争的著名北方将领——谢尔曼,切断自己的后勤保障,带领6万大军进军。林肯最初不同意他的策略,但谢尔曼拿到了美国的人口普查数据后,毅然决定将大军分为五路。谢尔曼通过对数据的分析,最终沿途经过的都是富庶之地,资源需求能够在当地得到满足,从而顺利走过了美国历史上著名的“死亡之路”。涂子沛总结道:“数据意识早在很多年前就被人所重视了。”


   涂子沛提出两个定义:“数据是对客观世界的测量和记录;而大数据则是传统的小数据和现代的大记录之和。大数据的特点是海量、多源、实时,而在这个数据爆炸的时代,我们需要数据英雄。”


   万物皆联网,无处不计算,产业互联将导致更大量级的数据爆炸。2020年,来自传感器的数据将占全部数据的百分之50。因此,涂子沛指出,现在的年轻人正迎来前所未有的创新机遇。石油等生产资料会消亡,而数据永远不会消亡,并且能产生一加一大于二的效应,数据能够产生新的价值。


   英美的数据大赛驱动了创新,而在中国,有阿里巴巴主办的天池黄金联赛则是为中国的青年们提供了创新机遇,天池数据大赛甚至能够使得中国人能在世界平台展现风采。“阿里巴巴已经将云服务推到美国,直接和亚马逊进行竞争,现在的同学比20年前的我更出于一个好的时代,一个更能融入国际的时代。”


   在去年,天池数据竞赛初赛提供1200万条行为数据,复赛提供58亿条行为数据,让参赛者预测消费者一个月后将会购买什么,通过一套评测方法计算分数。三场比赛共有128万总奖金,除此之外还提供TOP50校招绿色通道、风投机构关注、明星创业项目。


   去年决赛时,参赛者与天猫内部工程师进行PK,结果参赛者成功击败工程师。这进一步证明了参赛者的优秀及可塑性。


   4月25日天池大数据竞赛截止报名,目前为止有100多支华科队伍参赛,涂子沛先生给予了对参赛者的美好祝愿,无论是否为计算机系学生,都有可能成功。随着资源的开放,只要凭借兴趣、凭借爱好,也能够成功。“我作为计算机系的学生,在我上学期间,也特别喜爱听人文讲座,于是在现在我也成为了作家,正如马云所说——梦想是要有的。”


在未来,数据何去何从


   不仅仅局限于过去和现在,涂子沛先生对未来也进行了大胆的预测——家庭将成为微制造中心,改变生产、制造、物流和消费。未来的制造不仅仅是工厂制造,如3D打印可能在家庭进行。


   在未来,工业时代的先锋和信息时代的成果将两相结合。无人驾驶汽车五年后上市,阿里巴巴也开始互联网汽车计划。“互联网汽车不需要CD而是打开虾米软件收听音乐,它也会自动选择加油站线路。”

传统农业和信息时代的成果两相结合——无人机,会飞的传感器,它在未来将颠覆谷歌之类的地图服务。他谈及在美国居住时的体验:“一旦进入医院就马上会有护士为病患测量体温,然而穿戴式设备无时不刻记录着人体的数据,这在未来很有可能取代护士。”


   用数据优化服务业也将是重头戏,众所周知,谷歌搜索和微软搜索的差距不是算法,而是数据。当数据出现的时候,谷歌能够迅速意识到其重要性,并加以关注。而微软不能如此反应迅速从而逐渐落伍为人们所弃用。


   新经济就是以数据为基础的经济——信息经济、知识经济、智慧经济。人类正迈入新经济的时代。通过去伪存真,人们发现大数据只是现象,大算法才是本质。“资源是有限的,不可能再增加,只有合理利用才可能可持续发展。”


   最后涂子沛先生提及开放数据与公共数据:“开放完全不等同于公开,开放也不一定代表免费,开放的对象可以有范围;而公共数据有很大一部分是社会的基础性数据,如天气、人口、地理、经济指标、社会福利等,缺少它,全社会的数据难以有效整合。”


   大数据不是矿藏,而是土壤,开放的数据即为土地上的河流,河流流过之处,就会孕育发达的数据文明——这是《数据之巅》的一段话,此次他重提这句话,希望同学们能更加深刻的认识大数据的本质


与青年对话:激荡思想


   一位男生首先向涂子沛先生提问:“泡沫时代,作为学生该如何创业呢?”他答道:“学生的年龄适合创新而非创业,宝贵的时间应该应用于学习,因此我提倡的是万众创新而非大众创业。”


   当被问及为什么要放弃政府部门的稳定工作而选择改变,涂子沛深情回忆道那段最艰难的时光:“我曾经在武警部队工作很久,但我仍有寻求改变的力量,工作虽然稳定,但我知道我能够看到生活的尽头。“在他辞掉工作后,父亲为此和他大吵一架,甚至搬回老家。自己选择的道路上会遇到很多的困难,但要勇于坚持,忍受孤独。“我深刻的记得,导师问我为什么要来卡耐基梅隆大学,我的回答是——全球化我自己。”


   “电影《阿甘正传》中有这么一句台词——生命就像一盒巧克力,结果往往出人意料。我从来没有想到自己会写作。”当涂子沛2008.12月毕业的时候,半年没有工作。而他在家写的博客被编辑看中并发表,最终他写到了南方都市报,成为了专栏作家。


   一位女生表达了对大数据时代的担忧,作出了这样的回答,“美国的经济一直在停滞,但仍然处于一个爆发点。而在中国,我所认为的互联网+其实就是互联网的后信息时代,它渗透到所有的领域。”机器工作可能会带来失业问题,徐子沛在《数据之巅》最后一章提到过  45%工作都将被机器取代,但蛋糕做大在挑战中出现机遇,也就不怕了。中国正处于弯道超车的时代。


   “微信普及度甚至连美国都不能企及,中国市场的庞大和多元化是一个机遇,在时代的浪潮中我们应该明确自己要做什么,虽然有挑战但社会仍然是螺旋式上升。”


   美国经济学家预言未来有三种人:“生产数据的人、占有数据的人、会用数据的人。涂子沛认为数据科学应进入小学,大学则应提供更多的相关课堂。


   40 、50年代,日本产品是低劣产品的代名词 。但日本人善于学习并且严谨认真。“我曾经去上海陆家嘴的购物中心发现过建筑物已经漏水,这就体现了我们对细节的忽视。”数据关注细节,中国传统文化匮乏数据意识。在现代,中国人对科技的贡献极少,在数据时代我们要善于学习、要关注细节。我们不仅要学习日本、美国,凡是发达的,都要学习。学习不是羞耻,因为最好的学习是为了超越。


   华中科技大学法学院教授梁木生、阿里巴巴高级经理王一婷、阿里巴巴校园专家王听出席会议。


学校微博
单周单篇点击量排名