什么是大数据?”、“跟我有什么关系?”很多人第一次听到大数据,心中一定会有这样的疑问。 据《30杂志》报道,麦尔•荀伯格在千余名想了解未来趋势的观众面前,做了一场精彩易懂的演说,告诉了企业及民众,什么是大数据。 大数据找出相关性 2009年,全球出现一种新的流感病毒H1N1,当时美国也无法幸免,疾病管制局(CDC)要求第一线的医师遇到H1N1流感病例,必须立刻通报。即使如此,通报速度仍总是慢一步,会晚1到2个星期。这样的时效让疾管局无法掌握真实情况,对症下药。 当时有几位Google 工程师在著名的《自然》科学期刊中发表了一篇论文。他们透过美国最常使用的前5000万个搜寻关键字,再与疾管局2003-2008年间的流感传播资料加以比对,用高达4.5亿种不同的数学模型,找出这些字出现的频率、时间及地点,有没有统计上的相关性(correlation)。最后被他们挖到宝了,这套软件找出了45个流感关键字眼,放进数学模型之后,预测结果与官方公布的真实资料吻合,有强烈的相关性。 Google 运用这套数学模型,再一次精准地掌握了流感发生的高峰及地区,让防疫工作同步进行,不落后。 再说另一例子,天文学来说,美国太空总署执行一项叫史隆数码巡天计划(Sloan Digital Sky Survey),从2000年开始,他们用位于美国新墨西哥州的天文望远镜去收集资料,计划开始不过几星期,收到的天文资料量就已超过了过去所有天文学历史的总和。到了2010年,这个计划收到了140TB 的资料量。但是接续的新计划,预计2016年登场,未来的巡天望远镜在5天内,就可收到这些资料量。 荀伯格说,当资料进入天文数字时代,荀伯格提醒:到底大数据有多大?其实不是那么重要,重点是在放大,扩大资料量等级,就能做出少量资料做不到的事。
举例来说,画一张马的图画,不是太难的事,但如果画了很多张马的图画,再以每秒24帧来呈现这些图画,就成了动画。这里要强调的是“量变”产生了“质变”,巨量就是这个道理,量的不同,也改变了本质。 |
|
中国锻压网官方微信:扫一扫,立即关注!
关注"中国锻压网",获取独家行业新闻资讯。 添加方法1: 在“添加好友”中直接添加微信账号:chinaforge 添加方法2: 微信中扫描左侧的二维码 |