一篇文章看懂“大数据”

  获取数据、存储数据、分析数据,这一系列的行为,都不算新奇。我们每天都在用电脑,每天都在干这个事。但是,同样的行为,放在大数据身上,就行不通了。换言之,传统个人电脑,传统常规软件,无力应对的数据级别,才叫“大数据”。

  大家好,我是小枣君。

  今天这篇文章,我们来聊聊大数据。

一篇文章看懂“大数据”

  近年来,大数据这个词的热度很高,受到公众的广泛关注。

  对于很多人来说,当他第一次听到“大数据”这个词,会自然而然从字面上去理解——认为大数据就是大量的数据,大数据技术就是大量数据的存储技术。

  但事实上,它并不只是一项存储技术,而是一系列和海量数据相关的抽取、集成、管理、分析、解释技术。大数据系统,是一个庞大的框架系统。

  更进一步来说,大数据是一种全新的思维方式和商业模式。

一篇文章看懂“大数据”

  今天这篇文章,就让我们来深入了解一下,到底什么是大数据。

  大数据的定义

  首先,我们看看大数据的定义。

  行业里对大数据的定义有很多,有广义的定义,也有狭义的定义。

  广义的定义,有点哲学味道——大数据,是指物理世界到数字世界的映射和提炼。通过发现其中的数据特征,从而做出提升效率的决策行为。

  狭义的定义,是技术工程师给的——大数据,是通过获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。

  相比较而言,狭义定义更好理解一些。

  大家注意,关键词我都在上面原句加粗了:

  要做什么?——获取数据、存储数据、分析数据
  对谁做?——大容量数据
  目的是什么?——挖掘价值

  获取数据、存储数据、分析数据,这一系列的行为,都不算新奇。我们每天都在用电脑,每天都在干这个事。

  例如,每月的月初,考勤管理员会获取每个员工的考勤信息,录入Excel表格,然后存在电脑里,统计分析有多少人迟到、缺勤,然后扣TA工资。

  但是,同样的行为,放在大数据身上,就行不通了。(子午物联ziwuiot.com)换言之,传统个人电脑,传统常规软件,无力应对的数据级别,才叫“大数据”。

  大数据,到底有多大?

  我们传统的个人电脑,处理的数据,是GB/TB级别。例如,我们的硬盘,现在通常是1TB/2TB/4TB的容量。

  TB、GB、MB、KB的关系,大家应该都很熟悉了:

  1. 1 KB = 1024 B (KB - kilobyte)
  2. 1 MB = 1024 KB (MB - megabyte)
  3. 1 GB = 1024 MB (GB - gigabyte)
  4. 1 TB = 1024 GB (TB - terabyte)

  而大数据是什么级别呢?PB/EB级别。

一篇文章看懂“大数据”

  大部分人都没听过。其实也就是继续乘以1024:

  1. 1 PB = 1024 TB (PB - petabyte)
  2. 1 EB = 1024 PB (EB - exabyte)

  只是看这几个字母的话,貌似不是很直观。我来举个例子吧。

  1TB,只需要一块硬盘可以存储。容量大约是20万张照片或20万首MP3音乐,或者是20万部电子书。

普通硬盘

普通硬盘

  1PB,需要大约2个机柜的存储设备。容量大约是2亿张照片或2亿首MP3音乐。如果一个人不停地听这些音乐,可以听1900年。。。

2个机柜

2个机柜

  1EB,需要大约2000个机柜的存储设备。如果并排放这些机柜,可以连绵1.2公里那么长。如果摆放在机房里,需要21个标准篮球场那么大的机房,才能放得下。

21个篮球场

21个篮球场

  阿里、百度、腾讯这样的互联网巨头,数据量据说已经接近EB级。

阿里数据中心内景

阿里数据中心内景

  EB还不是最大的。目前全人类的数据量,是ZB级。

  1 ZB = 1024 EB (ZB - zettabyte)

  2011年,全球被创建和复制的数据总量是1.8ZB。

  而到2020年,全球电子设备存储的数据,将达到35ZB。如果建一个机房来存储这些数据,那么,这个机房的面积将比42个鸟巢体育场还大。

一篇文章看懂“大数据”

  数据量不仅大,增长还很快——每年增长50%。也就是说,每两年就会增长一倍。

  目前的大数据应用,还没有达到ZB级,主要集中在PB/EB级别。

声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场和对其真实性负责。若有侵权或异议请联系我们删除。
发表评论

相关文章

切换注册

登录

忘记密码 ?

切换登录

注册