什么是大数据,通俗的讲

kuaidi.ping-jia.net  作者:佚名   更新日期:2024-08-15
有没有大神能用通俗的语言讲一下什么是大数据?

要通俗的语言讲大数据就是它是多种互联网信息的集合,这就是我所理解的大数据我认为大数据它非常简单,就是说在现在我们的这个网络发展过程当中,它所产生的一种信息集合的产物,不是特别难以理解的一种东西,大数据现在很多互联网公司运用的比较普遍,通过大数据分析我们可以产出很多适合公司发展运用的分析,大数据的运用也使得我们经营运用的更加合理,避免了很多猜测。。

大数据时代,从我个人理解首先就是“样本=总体”,这是大的一个表现。我们不再选择随机数而是选择全部所拥有的数据,这样就有可能导致得到的结果具有一定的偏差,毕竟数据越多那么垃圾数据的概率也就越多。其次,就是放弃因果关系而选择利用相关关系,因为数据结果只是作为说明一个问题的参考,而不是全部。还有弊端就是大数据时代容易带来个人、企业的数据信息安全危机。所以需要法律与相关信息安全的行业技术都需要完善。大概就是这么多 。如果自己想了解的更深入的话 可以看《大数据时代》里面讲到的点很多也很有启发性!

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,简单来说大数据就是海量的数据,就是数据量大、来源广、种类繁多(日志、视频、音频),大到PB级别,现阶段的框架就是为了解决PB级别的数据。

大数据的7大特征:海量性,多样性,高速性,可变性,真实性,复杂性,价值性

随着大数据产业的发展,它逐渐从一个高端的、理论性的概念演变为具体的、实用的理念。

很多情况下大数据来源于生活。
比如你点外卖,准备什么时候买,你的位置在哪,商家位置在哪,想吃什么……这都是数据,人一多各种各样的信息就越多,还不断增长,把这些信息集中,就是大数据。

大数据的价值并不是在这些数据上,而是在于隐藏在数据背后的——用户的喜好、习惯还有信息。

1、大数据又称巨量资料,是海量具有高增长率和多样化特性的有价值的信息资产的集合。它不仅仅包括数字,还包括图片、文本、视频、交互记录等等。大数据无法在可承受时间范围内用常规软件工具进行捕捉、处理和管理。具有大亮、高速、多样、价值这四个特点,主要应用于计算机,它的最小单位是bit。

2、大数据可以说是云计算不断发展下的一个产物,同时也必须依托于云计算的分布式处理、分布式数据库、和云存储、虚拟化技术对海量数据进行分布式处理。

3、大数据中的信息资料大都来源于一些交互平台或者是公司企业、网站。这些信息经过处理后,其中一部分会转变为有规律的信息结构,这样就可以对他们进行分析从而利于企业的市场营销,甚至国家安全。



有人说大数据技术是第四次技术革命,这个说法其实不为过。
很多人只是听过大数据这个词或者是简单知道它是什么,那么它是什么呢,在这里就通俗点来说一下个人对大数据的理解。
大数据,很明显从字面上理解就是大量的数据,海量的数据。大,意思就是数据的量级很大,不上TB都不好意思说是大数据。数据,狭义上理解就是12345那么些数据,毕竟计算机底层是二进制来存的,那么在大数据领域,数据就不仅仅包括数字这些,它可以是所有格式的东西,比如日志,音频视频,文件等等。
所以,大数据从字面上理解就是海量的数据,技术上它包括这些海量数据的采集,过滤,清洗,存储,处理,查看等等部分,每一个部分包括一些大数据的相关技术框架来支持。
举个例子,淘宝双十一的总交易额的显示,后面就是大数据技术的支持,全国那么多淘宝用户的交易记录汇聚到一起,数据量很大,而且要做到实时的展现,就需要强有力的大数据技术来处理了。
数据量一大,那么得找地方来存,一个服务器硬盘可以挂多少,肯定满足不了这么大的数据量存储啊,所以,分布式的存储系统应运而生,那就是HDFS分布式文件系统。简单的说,就是把这么大的数据分开存在甚至几百甚至几千台服务器上,那么管理他们的系统就是HDFS文件系统,也是大数据技术的最基本的组件。
有地方存了,需要一些分布式的数据库来管理查询啊,那就有了Hbase等,还需要一些组件来计算分析这些数据啊,mapreduce是最基本的计算框架,其他的计算框架Spark和Storm可以完成实时的处理,其中HDFS和MapReduce组成了Hadoop1.
总之,一切都是数据。我们的历史,是不是都是大量的数据保存下来的,现在我们也是大数据的生活,天天有没有接到骚扰电话还知道你姓什么,你查话费什么的从几亿人的数据中查到你的信息,大数据生活。未来,大数据将更深刻的渗透到生活中。

在很多人的眼里大数据可能是一个很模糊的概念,但是,在日常生活中大数据有离我们很近,我们无时无刻不再享受着大数据所给我们带来的便利,个性化,人性化。全面的了解大数据我们应该从四个方面简单了解。定义,结构特点,我们身边有哪些大数据,大数据带来了什么,这四个方面了解。
那么“大数据”到底是什么呢?

在麦肯锡全球研究所给出的定义中指出:大数据即是一种规模大到在获取,存储,管理,分析方面大大超出了传统数据库软件工具能力范围的数据集合。简单而言大数据是数据多到爆表。大数据的单位一般以PB衡量。那么PB是多大呢?1GB=1024MB ,1PB=1024GB才足以称为大数据。

如图:

衡量单位一览表
其次,大数据具有什么样的特点和结构呢?

大数据从整体上看分为四个特点,
第一,大量。

衡量单位PB级别,存储内容多。
第二,高速。

大数据需要在获取速度和分析速度上要及时迅速。保证在短时间内更多的人接收到信息。
第二,多样。

数据的来源是各种渠道上获取的,有文本数据,图片数据,视频数据等。因此数据是多种多样的。
第三,价值。

大数据不仅仅拥有本身的信息价值,还拥有商业价值。大数据在结构上还分为:结构化,半结构化,非结构化。结构化简单来讲是数据库,是由二维表来逻辑表达和实现的数据。非结构化即数据结构不规则或不完整,没有预定义的数据模型。由人类产生的数据大部分是非结构化数据。

大数据指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语,在总数据量相同的情况下,与个别分析独立的小型数据集(Data set)相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系。随着大数据被越来越多的提及,有些人惊呼大数据时代已经到来了,2012年《纽约时报》的一篇专栏中写到,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。
白话一下,我们的衣食住行沟通都会产生数据,这些数据的量级很大,我们就把他称之为大数据,为什么它如此重要?商家可以通过对数据的分析更好的盈利,政府可以借用大数据解决老赖等社会问题,作为普通人则可以享受互联网发展带来的红利

  • 如何通俗地解释大数据?
    答:大数据通俗的解释就是海量的数据,顾名思义,大就是多、广的意思,而数据就是信息、技术以及数据资料,合起来就是多而广的信息、技术、以及数据资料。那么,该怎么去了解大数据呢,比如说我们在浏览网页的时候,必然是有喜好的,而通过大数据分析会过滤掉一些我们不感兴趣的信息,为我们更多的呈现感兴趣...
  • 大数据是什么?通俗易懂一点 昨天听别人说 自己蒙了
    答:1. 大数据与传统数据相对,传统数据处理成本高,通常只处理规范数据,无法处理如文本、图片等非结构化数据。2. 当数据量大到一定程度,传统方法只能通过抽样来分析。3. 大数据的四大特征包括:- Volume(体量):数据量大,涉及海量数据。- Variety(多样性):数据类型丰富,包括文本、音频、视频、传感器...
  • 大数据是什么意思通俗易懂的解释
    答:首先来说一下什么是大数据,上世纪90年代末,美国航空航天局的研究人员创造了大数据一词,自诞生以来,它一直是一个模糊而诱人的概念,直到最近几年,才跃升为一个主流词汇。其实简单的来说,大数据就是通过分析和挖掘全量的非抽样的数据辅助决策。大数据可以实现的应用可以概括为两个方向,一个是精准化...
  • 什么是大数据?要简单通俗点的解释?
    答:什么是大数据及应用?大数据即为海量数据。人类生活在三维空间中,一草一木,一山一水,人类活动的行为轨迹,都能用数据来表达。如企业的生产运营,商品标准。政府的管理决策,消费者的消费水平,消费习惯。地理环境的一条公路,一条河流等等。每方面都有每方面的大数据。每个行业都有每个行业的大数据。通过...
  • 大数据是什么?
    答:大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 [1] 中大数据指不用随机...
  • 大数据是什么意思 说的通俗易懂一点
    答:是指无法再一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力来适应海量,高增长率和多样化的信息资产———柠檬学院大数据培训为nin解答。
  • 什么是大数据?
    答:大数据可应用于各行各业,将人们收集到的庞大数据进行分析整理,实现资讯的有效利用。举个本专业的例子,比如在奶牛基因层面寻找与产奶量相关的主效基因,我们可以首先对奶牛全基因组进行扫描,尽管我们获得了所有表型信息和基因信息,但是由于数据量庞大,这就需要采用大数据技术,进行分析比对,挖掘主效基...
  • 大数据到底是啥?在哪里?(通俗解释)
    答:大数据不仅仅拥有本身的信息价值,还拥有商业价值。大数据在结构上还分为:结构化,半结构化,非结构化。结构化简单来讲是数据库,是由二维表来逻辑表达和实现的数据。非结构化即数据结构不规则或不完整,没有预定义的数据模型。由人类产生的数据大部分是非结构化数据。那我们身边有哪些东西是大数据呢?...
  • 大数据通俗易懂的说法
    答:大数据,一个自上世纪90年代末由美国航空航天局研究人员提出的术语,近年来已成为流行词汇。它的核心在于通过分析大量非抽样数据来辅助决策过程。大数据的应用主要体现在两个方面:个性化定制和预测。个性化定制的一个例子是搜索引擎。当用户搜索相同内容时,每个人获得的搜索结果却可能大相径庭。这得益于大数据...
  • 揭秘大数据的产生,什么是大数据
    答:大数据的处理速度非常快,有时甚至需要在1秒内完成处理。这一点与传统的数据挖掘技术有本质的不同。6. 大数据的来源 大数据来自各种渠道,包括物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及各种传感器等。这些渠道不仅是数据的来源,也是数据承载的方式。7. 大数据的通俗理解 通俗来说,...