大数据是什么?

kuaidi.ping-jia.net  作者:佚名   更新日期:2024-09-10
什么是大数据?

大数据是指在一定时间内,常规软件工具无法捕捉、管理和处理的数据集合。它是一种海量、高增长、多元化的信息资产,需要一种新的处理模式,以具备更强的决策、洞察和流程优化能力。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些有意义的数据进行专业的处理。换句话说,如果把大数据比作一个行业,这个行业盈利的关键在于提高数据的“处理能力”,通过“处理”实现数据的“增值”。

从技术上讲,大数据和云计算的关系就像硬币的正反面一样密不可分。大数据不能用单台计算机处理,必须采用分布式架构。其特点在于海量数据的分布式数据挖掘。但它必须依赖云计算分布式处理、分布式数据库、云存储和虚拟化技术。





扩展信息:

大数据只是现阶段互联网的一个表征或特征。没有必要将其神话或保持敬畏。在以云计算为代表的技术创新背景下,这些原本看似难以收集和使用的数据开始被轻松使用。通过各行各业的不断创新,大数据将逐渐为人类创造更多的价值。

是体现大数据技术价值的手段,是进步的基石。这里从云计算、分布式处理技术、存储技术、感知技术的发展,阐述大数据从采集、处理、存储到形成结果的全过程。

实践是大数据的终极价值。在这里,我们从互联网大数据、政府大数据、企业大数据、个人大数据四个方面来描绘大数据的美好图景和将要实现的蓝图。

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,简单来说大数据就是海量的数据,就是数据量大、来源广、种类繁多(日志、视频、音频),大到PB级别,现阶段的框架就是为了解决PB级别的数据。

大数据的7大特征:海量性,多样性,高速性,可变性,真实性,复杂性,价值性

随着大数据产业的发展,它逐渐从一个高端的、理论性的概念演变为具体的、实用的理念。

很多情况下大数据来源于生活。
比如你点外卖,准备什么时候买,你的位置在哪,商家位置在哪,想吃什么……这都是数据,人一多各种各样的信息就越多,还不断增长,把这些信息集中,就是大数据。

大数据的价值并不是在这些数据上,而是在于隐藏在数据背后的——用户的喜好、习惯还有信息。

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 [1] 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

大数据的概念可能不同的人会有不同的理解,我自己从08年开始从事大数据相关的工作,那个时候我们是觉得自己搞的是云计算和数据仓库,而到了2011、2012年的时候,国内大数据的概念才兴起来,之后就是炒了三年的概念。

因为从事这一方向,这几年不断会有人问我什么是大数据?我一直都回答不好。在最近的几个月,我对这一概念思考的更多一些,结合看过的一些资料(如《大数据时代》、《数学之美》第二版、《硅谷之谜》、吴军的演讲材料等)和实际的经历,算是有了一些认识。与其说认识,还不如说是总结,换个角度看待这个问题,分为大数据概念和大数据思维。

我把大数据的概念总结为四个字:大、全、细、时。

大数据之大

我们先来看一组数据:
百度每天采集的用户行为数据有1.5PB以上
全国各地级市今天的苹果价格数据有2MB
1998年Google抓取的互联网页面共有47GB(压缩后)
一台风力发电机每天产生的振动数据有50GB

百度每天的行为数据1.5个PB够大吧?我们毫无怀疑这是大数据。但全国各个地级市今天的苹果价格只有2MB大小,是典型的小数据吧?但如果我们基于这个数据,做一个苹果分销的智能调度系统,这就是个牛逼的大数据应用了。Google在刚成立的时候,佩奇和布林下载了整个互联网的页面,在压缩后也就47GB大小,现在一个U盘都能装的下,但Google搜索显然是个大数据的应用。如果再来看一台风机每天的振动数据可能都有50GB,但这个数据只是针对这一台风机的,并不能从覆盖面上,起到多大的作用,这我认为不能叫大数据。

这里就是在强调大,是Big不是Large,我们强调的是抽象意义的大。

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

"大数据"可以简单理解为是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。
大数据可以做什么?
大数据的核心作用是数据价值化,简单的说就是大数据让数据产生各种“价值”,这个数据价值化的过程就是大数据要做的主要事情。
简单的说,大数据可以做的是:
记录、描述、预测一切。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
大数据不仅包括企业内部应用系统的数据分析,还包括与行业、产业的深度融合。具体场景包括:互联网行业、政府行业、金融行业、传统企业中的地产、医疗、能源、制造、电信行业等等。通俗地讲“大数据就像互联网+,可以应用在各行各业",如电信、金融、教育、医疗、军事、电子商务甚至政府决策等。

  • 什么是大数据?
    答:1、大数据 IT行业术语,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。2、视频流 视频数据的传输,例如,它能够被作为一个稳定的和连续的流通过网络处理。因为流动,客户机浏览...
  • 什么叫大数据?
    答:专业解释:大数据英文名叫big data,是一种IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。通俗解释:大数据通俗的解释就是海量的数据,顾名思义,大就是多、广...
  • “大数据”是什么意思?请举例说明。
    答:大数据,顾名思义,指的是数据量巨大、难以用常规软件工具在一定时间内进行捕捉、管理和处理的数据。这些数据不仅包括结构化数据,如数据库中的数字和事实,还包括非结构化数据,如社交媒体上的文本、图片、视频等。大数据的核心价值在于通过分析和挖掘,发现数据背后的规律和趋势,为决策提供支持。二、大数...
  • 什么是大数据?它有哪些特点?
    答:1、大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。2、特点:大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。2、“大数据”概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写《大数据时...
  • 大数据是什么意思
    答:大数据是指在特定时间内,使用常规软件工具无法处理、管理和分析的庞大数据量。大数据具有数据量大、产生速度快、种类繁多等特点。随着信息技术的快速发展,大数据已经渗透到各行各业,成为重要的资源。下面将对大数据进行详细的解释:1.大数据的基本概念:大数据是指在传统数据处理软件难以处理的庞大的、复杂的...
  • 什么是“大数据”,如何理解“大数据”
    答:你好,大数据是指巨量的数据,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。当下,大数据技术作为新兴技术被许多互联网大厂所需,以华为为例。1、华为云推出大数据稽核方案解决偷逃费 很多朋友可能发现,部分省界收费站变少而ETC通道在增加,高速公路...
  • 什么是大数据?
    答:生活中的大数包括以下几种:一、人口数量 人口数量是生活中常见的大数之一。全球人口已经突破70亿,而在一些人口密集的国家,如中国、印度等,人口数量更是达到了数十亿。此外,城市的居民数量也常常是巨大的数字。以城市为例,中国的一些大都市常住人口就已经突破千万。庞大的数据体现了全球人类的数量规模...
  • 大数据是什么?
    答:大数据是指海量数据的集合,这些数据规模庞大、种类繁多、处理速度快,并且具有巨大的价值。一、大数据的基本概念 大数据是指那些难以在常规软件工具一定时间内获取、处理、分析和挖掘的数据集。这些数据不仅在规模上庞大,而且在类型、处理速度和应用价值等方面也有着独特的特点。大数据通常涉及的是以亿万为单位...
  • 什么是大数据
    答:大数据又称巨量数据、海量数据,是由数量巨大、结构复杂、类型众多的数据构成的数据集合。基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。换言之...
  • 大数据是指什么 大数据是什么意思?
    答:1、大数据(Big Data)是指规模极大且复杂的数据集合,通常由传统数据处理工具无法有效处理和管理。这些数据集通常包含结构化数据(例如关系型数据库中的表格数据)、半结构化数据(例如XML、JSON等)和非结构化数据(例如文本、图像、音频、视频等)。2、大数据的特点可以总结为三个V,即:Volume(数据量...