大数据时代发展历程是什么?

kuaidi.ping-jia.net  作者:佚名   更新日期:2024-08-19
中国互联网发展历程

第一次互联网大浪潮1994年—2000年
从四大门户到搜索
1994年正式接入国际互联网.
1997年6月,丁磊创立网易公司;
1998年张朝阳正式成立搜狐网;
1998年 邮箱普及&第一单网上支付完成
1998年11月腾讯成立 ,由马化腾、张志东等五位创始人创立。
1998年12月,由王志东先生创立新浪
1999年 聊天软件QQ出现,当时叫 OICQ,后改名腾讯QQ风靡全国。
1999年9月9日马云带领下的18位创始人在杭州正式成立了阿里巴巴集团
2000年1月1日李彦宏在中关村创建了百度公司

第二次互联网大浪潮(2001年—2008年)
从搜索到社交化网络
(博客、sns、论坛、微博)
2001年中国互联网协会成立
2002年,博客网成立
2002年,个人门户兴起,互联网门户进入2.0时代。
2003年 淘宝网上线,后来成为全球最大C2C电商平台;下半年,阿里巴巴推出支付宝。
2004年 网游市场风起云涌
2005年博客元年
2006年熊猫烧香病毒泛滥,名为“熊猫烧香”的计算机蠕虫病毒感染数百万台计算机
2007年 电商服务业确定为国家重要新兴产业
2008年 中国网民首次超过美国

第三次互联网大浪潮(2009年—2014年)
PC互联网到移动互联网
(入口从搜索到各种各样app分流)
2009年 SNS社交网站活跃,人人网(校内网)、开心网、QQ、等SNS平台为代表
2010年团购网站兴起,数量超过1700家,团购成为城市一族最潮的消费和生活方式。
2011年微博迅猛发展对社会生活的渗透日益深入,政务微博、企业微博等出现井喷式发展。
2012年手机网民规模首次超过台式&微信朋友圈上线
2012年3月今日头条上线
2012年双11阿里天猫与淘宝的总销售额达到191亿
被业内称为双十一的爆发点,这一年淘宝商城正式更名为天猫。2012年双十一当日,天猫与淘宝的总销售额达到191亿,其中天猫达到132亿淘宝也有59亿。
2013年余额宝上线
2013年淘宝双十一销售额:350亿元
2014年 打车软件烧钱发红包,滴滴快的巨资红包抢用户,“互联网+交通”出行.
2014年阿里上市之后的第一个双十一:571亿元
2015年 首次提出“互联网+”;
2015年阿里巴巴集团宣布当日双十一销售额达到:912亿元
2016年,互联网直播、网红等热词“风靡全国”, 短视频造就第一网红papi酱!
2017年自媒体百家争鸣,互联网BAT第一梯队,第二梯队等纷纷砸金压自媒体平台,(百家号,搜狐号,网易号,大yu号、京东号、迅雷号等)
2016年天猫双十一狂欢节成交额 1207亿元 人民币
2016年12月3日知识付费掘起,
2016年12月3日,喜马拉雅FM中国第一个知识内容狂欢节,称为“123知识狂欢节”,消费超过5000万.
2017年微信推出看一看,搜一搜.
扩展资料:
互联网发展的趋势和特点:
1、手机上网比例首超传统PC上网比例,移动互联网带动整体互联网发展
2、互联网发展从“广”到“深”,网民生活全面“互联网化”
3、支付类应用领涨,推动电商基因渗透更多线下消费场景
4、手机游戏异军突起,带动整体网络游戏使用率逆转增长
5、互联网理财用户初具规模,网络金融服务创新潮涌
6、社交网站使用率持续下滑,社交元素与其他应用的融合已成常态
参考资料:
百度百科-中国互联网

互联网的发展大致分为三个阶段:
第一阶段:从单个网络APPANET向互联网发展;TCP/IP协议的初步成型;
1969年美国国防部创建的第一个分组交换网ARPANET最初只是一个单个的分组交换网(并不是一个互连的网络)。所有要连接的在ARPANET上的主机都直接与就近的结点交换机相连。
为了打破这个问题,于是ARPA开始研究多种网络(如分组无线电网络)互连的技术,这就导致后来互联网的出现,成为了现在因特网的雏形。
1983年TCP/IP协议成为ARPANET上的标准协议,使得所有使用TCP/IP协议的计算机都能利用互联网进行通信,因而人们将1983年作为因特网的诞生之间。
1990年ARPANET正式宣布结束,因为它的实验任务已经完成。
第二阶段:建成三级结构的Internet;分为主干网、地区网和校园网;
之后美国政府机构认识到,因特网必将扩大其使用范围,不应局限于大学和研究机构,之后随着世界上的许多公司纷纷接入到因特网,是网络上的通信量急剧增大。
于是美国政府决定将因特网的主干网转交给私人公司来经营。
第三阶段:形成多层次ISP结构的Internet;ISP首次出现。
从1993年开始,由美国政府资助的NSFNET逐渐被若干个商用的因特网主干网替代。
就这一出现了一个新的名词:因特网服务提供者,简称ISP(Internet Service Provider)。
ISP可以从因特网管理机构申请得到多个IP地址,同时拥有通信线路及路由器等联网设备。用户只需要向ISP交纳规定费用,就可以从ISP得到所需的IP地址,并通过该ISP接入到因特网。

扩展资料
现在,很多人都知道互联网的特点:平等、自由。
但美国一直以来都反对中国加入互联网络。1991年10月的中美高能物理研究会上,美方发言人沃尔特.托基(Walter Toki)再次提出把中国纳入互联网络。
经过托氏的努力,会后双方达成一项协议:美方资助中国联网所需的一半经费,另一半由高能所自选解决。然而,通往Internet荆棘之路并未因此而变得平坦。
当时北京出口所连接的每条线路都要经过仔细地检查。美国还限制对中国出中路由器。
经过重重波折,中国终于在1993年3月与互联网络连通。
参考资料: 百度百科-计算机网络

大数据技术发展史:大数据的前世今生

今天我们常说的大数据技术,其实起源于Google在2004年前后发表的三篇论文,也就是我们经常听到的“三驾马车”,分别是分布式文件系统GFS、大数据分布式计算框架MapReduce和NoSQL数据库系统BigTable。

你知道,搜索引擎主要就做两件事情,一个是网页抓取,一个是索引构建,而在这个过程中,有大量的数据需要存储和计算。这“三驾马车”其实就是用来解决这个问题的,你从介绍中也能看出来,一个文件系统、一个计算框架、一个数据库系统。

现在你听到分布式、大数据之类的词,肯定一点儿也不陌生。但你要知道,在2004年那会儿,整个互联网还处于懵懂时代,Google发布的论文实在是让业界为之一振,大家恍然大悟,原来还可以这么玩。

因为那个时间段,大多数公司的关注点其实还是聚焦在单机上,在思考如何提升单机的性能,寻找更贵更好的服务器。而Google的思路是部署一个大规模的服务器集群,通过分布式的方式将海量数据存储在这个集群上,然后利用集群上的所有机器进行数据计算。 这样,Google其实不需要买很多很贵的服务器,它只要把这些普通的机器组织到一起,就非常厉害了。

当时的天才程序员,也是Lucene开源项目的创始人Doug Cutting正在开发开源搜索引擎Nutch,阅读了Google的论文后,他非常兴奋,紧接着就根据论文原理初步实现了类似GFS和MapReduce的功能。

两年后的2006年,Doug Cutting将这些大数据相关的功能从Nutch中分离了出来,然后启动了一个独立的项目专门开发维护大数据技术,这就是后来赫赫有名的Hadoop,主要包括Hadoop分布式文件系统HDFS和大数据计算引擎MapReduce。

当我们回顾软件开发的历史,包括我们自己开发的软件,你会发现,有的软件在开发出来以后无人问津或者寥寥数人使用,这样的软件其实在所有开发出来的软件中占大多数。而有的软件则可能会开创一个行业,每年创造数百亿美元的价值,创造百万计的就业岗位,这些软件曾经是Windows、Linux、Java,而现在这个名单要加上Hadoop的名字。

如果有时间,你可以简单浏览下Hadoop的代码,这个纯用Java编写的软件其实并没有什么高深的技术难点,使用的也都是一些最基础的编程技巧,也没有什么出奇之处,但是它却给社会带来巨大的影响,甚至带动一场深刻的科技革命,推动了人工智能的发展与进步。

我觉得,我们在做软件开发的时候,也可以多思考一下,我们所开发软件的价值点在哪里?真正需要使用软件实现价值的地方在哪里?你应该关注业务、理解业务,有价值导向,用自己的技术为公司创造真正的价值,进而实现自己的人生价值。而不是整天埋头在需求说明文档里,做一个没有思考的代码机器人。

Hadoop发布之后,Yahoo很快就用了起来。大概又过了一年到了2007年,百度和阿里巴巴也开始使用Hadoop进行大数据存储与计算。

2008年,Hadoop正式成为Apache的顶级项目,后来Doug Cutting本人也成为了Apache基金会的主席。自此,Hadoop作为软件开发领域的一颗明星冉冉升起。

同年,专门运营Hadoop的商业公司Cloudera成立,Hadoop得到进一步的商业支持。

这个时候,Yahoo的一些人觉得用MapReduce进行大数据编程太麻烦了,于是便开发了Pig。Pig是一种脚本语言,使用类SQL的语法,开发者可以用Pig脚本描述要对大数据集上进行的操作,Pig经过编译后会生成MapReduce程序,然后在Hadoop上运行。

编写Pig脚本虽然比直接MapReduce编程容易,但是依然需要学习新的脚本语法。于是Facebook又发布了Hive。Hive支持使用SQL语法来进行大数据计算,比如说你可以写个Select语句进行数据查询,然后Hive会把SQL语句转化成MapReduce的计算程序。

这样,熟悉数据库的数据分析师和工程师便可以无门槛地使用大数据进行数据分析和处理了。Hive出现后极大程度地降低了Hadoop的使用难度,迅速得到开发者和企业的追捧。据说,2011年的时候,Facebook大数据平台上运行的作业90%都来源于Hive。

随后,众多Hadoop周边产品开始出现,大数据生态体系逐渐形成,其中包括:专门将关系数据库中的数据导入导出到Hadoop平台的Sqoop;针对大规模日志进行分布式收集、聚合和传输的Flume;MapReduce工作流调度引擎Oozie等。

在Hadoop早期,MapReduce既是一个执行引擎,又是一个资源调度框架,服务器集群的资源调度管理由MapReduce自己完成。但是这样不利于资源复用,也使得MapReduce非常臃肿。于是一个新项目启动了,将MapReduce执行引擎和资源调度分离开来,这就是Yarn。2012年,Yarn成为一个独立的项目开始运营,随后被各类大数据产品支持,成为大数据平台上最主流的资源调度系统。

同样是在2012年,UC伯克利AMP实验室(Algorithms、Machine和People的缩写)开发的Spark开始崭露头角。当时AMP实验室的马铁博士发现使用MapReduce进行机器学习计算的时候性能非常差,因为机器学习算法通常需要进行很多次的迭代计算,而MapReduce每执行一次Map和Reduce计算都需要重新启动一次作业,带来大量的无谓消耗。还有一点就是MapReduce主要使用磁盘作为存储介质,而2012年的时候,内存已经突破容量和成本限制,成为数据运行过程中主要的存储介质。Spark一经推出,立即受到业界的追捧,并逐步替代MapReduce在企业应用中的地位。

一般说来,像MapReduce、Spark这类计算框架处理的业务场景都被称作批处理计算,因为它们通常针对以“天”为单位产生的数据进行一次计算,然后得到需要的结果,这中间计算需要花费的时间大概是几十分钟甚至更长的时间。因为计算的数据是非在线得到的实时数据,而是历史数据,所以这类计算也被称为大数据离线计算。

而在大数据领域,还有另外一类应用场景,它们需要对实时产生的大量数据进行即时计算,比如对于遍布城市的监控摄像头进行人脸识别和嫌犯追踪。这类计算称为大数据流计算,相应地,有Storm、Flink、Spark Streaming等流计算框架来满足此类大数据应用的场景。 流式计算要处理的数据是实时在线产生的数据,所以这类计算也被称为大数据实时计算。

在典型的大数据的业务场景下,数据业务最通用的做法是,采用批处理的技术处理历史全量数据,采用流式计算处理实时新增数据。而像Flink这样的计算引擎,可以同时支持流式计算和批处理计算。

除了大数据批处理和流处理,NoSQL系统处理的主要也是大规模海量数据的存储与访问,所以也被归为大数据技术。 NoSQL曾经在2011年左右非常火爆,涌现出HBase、Cassandra等许多优秀的产品,其中HBase是从Hadoop中分离出来的、基于HDFS的NoSQL系统。

我们回顾软件发展的历史会发现,差不多类似功能的软件,它们出现的时间都非常接近,比如Linux和Windows都是在90年代初出现,Java开发中的各类MVC框架也基本都是同期出现,Android和iOS也是前脚后脚问世。2011年前后,各种NoSQL数据库也是层出不群,我也是在那个时候参与开发了阿里巴巴自己的NoSQL系统。

事物发展有自己的潮流和规律,当你身处潮流之中的时候,要紧紧抓住潮流的机会,想办法脱颖而出,即使没有成功,也会更加洞悉时代的脉搏,收获珍贵的知识和经验。而如果潮流已经退去,这个时候再去往这个方向上努力,只会收获迷茫与压抑,对时代、对自己都没有什么帮助。

但是时代的浪潮犹如海滩上的浪花,总是一浪接着一浪,只要你站在海边,身处这个行业之中,下一个浪潮很快又会到来。你需要敏感而又深刻地去观察,略去那些浮躁的泡沫,抓住真正潮流的机会,奋力一搏,不管成败,都不会遗憾。

正所谓在历史前进的逻辑中前进,在时代发展的潮流中发展。通俗的说,就是要在风口中飞翔。

上面我讲的这些基本上都可以归类为大数据引擎或者大数据框架。而大数据处理的主要应用场景包括数据分析、数据挖掘与机器学习。数据分析主要使用Hive、Spark SQL等SQL引擎完成;数据挖掘与机器学习则有专门的机器学习框架TensorFlow、Mahout以及MLlib等,内置了主要的机器学习和数据挖掘算法。

此外,大数据要存入分布式文件系统(HDFS),要有序调度MapReduce和Spark作业执行,并能把执行结果写入到各个应用系统的数据库中,还需要有一个大数据平台整合所有这些大数据组件和企业应用系统。

图中的所有这些框架、平台以及相关的算法共同构成了大数据的技术体系,我将会在专栏后面逐个分析,帮你能够对大数据技术原理和应用算法构建起完整的知识体系,进可以专职从事大数据开发,退可以在自己的应用开发中更好地和大数据集成,掌控自己的项目。

希望对您有所帮助!~



第一阶段,运营式系统阶段。在上世纪七八十年代,用户购物时产生的记录一条条输入数据库,当时都是由这些运营系统生成这些数据的。

第二阶段,由用户原创内容阶段。2002年的时候,开始有了博客,后来发展成微博,到后来出现的微信,这些让每个网民都成了自媒体,都可以自己随心所欲地向网络发布相关的信息,这个时候数据产生的速度要远远大于之前的仅仅由运营系统产生的数据。

第三阶段,感知式系统阶段。真正让大数据时代由量变到质变是因为数据产生的方式到了第三个阶段——感知式系统阶段。

感知式系统阶段也就是物联网的大规模普及,物联网的迅速发展让大数据时代最终到来。

大数据是互联网发展到一定阶段的必然产物:

由于互联网在资源整合方面的能力在不断增强,互联网本身必须通过数据来体现出自身的价值,所以从这个角度来看,大数据正在充当互联网价值的体现者。

随着更多的社会资源进行网络化和数据化改造,大数据所能承载的价值也必将不断提到提高,大数据的应用边界也会不断得到拓展,所以在未来的网络化时代,大数据自身不仅能够代表价值,大数据自身更是能够创造价值。



可按照时间点划分大数据的发展历程。





互联网时代的来临,简易的说是海量信息同极致数学计算融合的结果。除此以外是移动互联、物联网技术造成了大量的数据信息,互联网大数据建筑科学极致地解决了海量信息的搜集、储存、测算、剖析的难题。互联网时代打开人类社会运用数据价值的另一个时期。
互联网大数据(BigData)又称之为大量材料,便是数据信息大、数据来源宽阔(系统日志、视频、声频),大到PB级别,目前的架构便是以便处理
PB级别的数据信息;到目前为止,人们生产制造的全部印刷耗材的信息量也但是200PB;阿里巴巴、京东商城、苏宁易购基础都沉定了PB级别;等于一家BAT企业(百度搜索、阿里巴巴、腾迅)顶过去全部人们时期生产制造的包装印刷材料
互联网大数据便是解决海量信息的,工作中便是储存,清理,查寻,导出来,必须SQL句子和编程工具脚本制作适用
互联网大数据一般用于描述一个企业造就的很多非结构型和半非结构化数据,这种数据信息在免费下载到关联型数据库查询用以剖析时候花销过多时间和钱财。数据分析常和云计算技术联络到一起,由于即时的大中型数据剖析必须像MapReduce一样的架构来向数十、百余或乃至千余的电脑上分派工作中。
依据《大数据时代》中常说,互联网大数据并不是一个准确的定义,大量的是一种将会的方法。“互联网大数据是大家在规模性数据信息的基本上能够保证的事儿,而这种事儿在小规模纳税人数据信息的基本上是没法进行的。互联网大数据是大家得到 新的认知能力、造就新的使用价值的原动力,互联网大数据还为更改销售市场
“互联网大数据即一种新式的工作能力:以一种史无前例的方法,根据对海量信息开展剖析,得到 有极大使用价值的商品和服务项目,或刻骨铭心的洞悉。

  • 大数据时代发展历程是什么?
    答:大数据时代发展历程是什么?  我来答 5个回答 #热议# 网上掀起『练心眼子』风潮,真的能提高情商吗? 尚学堂java学院 2020-12-01 · 百度认证:北京尚学堂科技有限公司官方账号 尚学堂java学院 向TA提问 关注 展开全部 大数据技术发展史:大数据的前世今生 今天我们常说的大数据技术,其实起源于Google在2004...
  • 大数据的概念和发展历程简述
    答:1. 大数据是指那些超出常规软件工具处理能力的海量数据集合,这些数据在一定时间内难以管理和分析。2. 它需要特殊的处理模式来提升决策制定、洞察发现和流程优化的能力。3. 大数据被视为一种重要的信息资产,其特点是数量庞大、增长迅速且类型多样。4. 在《大数据时代》一书中,维克托·迈尔-舍恩伯格和...
  • 啥叫大数据技术啊
    答:大数据发展到今天,通常来说有两层含义,海量的数据集合以及对海量数据集合进行处理的大数据技术。海量的数据集合,这个非常好理解,就是不断累积起来的数据资源,而大数据技术又是指什么呢?何为大数据技术,今天我们来对大数据技术发展历程做个简单的介绍。从定义来说,大数据技术是指从各种各样类型的巨量...
  • 大数据的历史
    答:二、大数据时代发展历程是什么 可按照时间点划分大数据的发展历程。 大数据时代发展的具体历程如下:2005年Hadoop项目诞生。 Hadoop其最初只是雅虎公司用来解决网页搜索问题的一个项目,后来因其技术的高效性,被Apache Software Foundation公司引入并成为开源应用。 Hadoop本身不是一个产品,而是由多个软件产品组成的一个生态系...
  • 数据发展的历程
    答:大数据的发展历程 随着计算机和网络的发展,信息不断“爆炸”:1970s: 超大规模数据库 (VLDB)【GB=10^9字节】21世纪初:海量数据(massive data)【TB=10^12字节】2008年:Big data 【PB=10^15字节】现在实际的数据量已经达到:ZB=10^3EB=10^6PB=10^21字节 一个新单位:1YB=10^3ZB=10^24...
  • 大数据的产生与发展现状研究
    答:发展历程:十年来大数据产业高速增长,我国信息智能化程度得到显著提升 我国大数据产业布局相对较早,2011年,工信部就把信息处理技术作为四项关键技术创新工程之一,为大数据产业发展奠定了一定的政策基础。自2014年起,“大数据”首次被写进我国政府工作报告,大数据产业上升至国家战略层面,此后,国家大数据综合...
  • 大数据的概念和发展历程是什么
    答:1. 大数据是指那些超出常规软件工具处理能力的数据集合。2. 它可以在一定时间内被捕捉、管理和处理。3. 利用大数据,企业能够分析消费者的喜好和需求。4. 通过这种分析,企业可以实现精准营销、信用评估和消费行为分析等目标。
  • 大数据分析时代对市场营销的影响研究
    答:(二)大数据时代企业精准营销成为可能 在大数据时代下,技术的发展大大超过了企业的想象。搜集非结构化的信息已经成为一种可能,大数据不单单仅能了解细分市场的可能,更通过真正个性化洞察精确到每个顾客。通过数据的挖掘和深入分析,企业可以掌握有价值的信息帮助企业发现顾客思维模式、消费行为模式。尤其在今天...
  • 信息技术的发展历程与发展趋势?
    答:信息技术(InformationTechnology,简称IT)的发展历程可以大致分为以下几个阶段:1.计算机诞生(1940年代):信息技术发展的早期阶段,主要表现为电子计算机的诞生和应用。计算机的诞生极大地提高了信息处理和计算的速度,使得大规模数据处理成为可能。2.编程时代(1950年代-1960年代):随着计算机硬件和软件的...
  • 大数据未来将是怎样的发展趋势
    答:在下游应用市场,我国大数据应用范围正在快速向各行各业延伸,除发展较早的政务大数据、交通大数据外,在工业、金融、健康医疗等众多领域大数据应用均初见成效。 产业发展历程:十年来大数据产业高速增长,信息智能化程度得到显著提升 我国大数据产业布局相对较早,2011年,工信部就把信息处理技术作为四项关键技术创新工程之一,为大...