大数据、云计算等新一代信息产业发展情况

2017-03-29 14:59:12

   我的这个分享是我们中国信息通信研究院每年我们会对大数据、云计算整个产业技术它的相关政策、法律法规都会有一些追踪,每年都会有一些白皮书,深度观察来发布,这个基本上是我们内容的一个集合。

  今天在座我相信有一部分是大数据产业峰会的观众,也有一部分是招商证券专门邀请来的投资方,也有很多是我们的会员单位,以及可能有一些在大数据和人工智能领域的一些创业、创新的企业。我想我的开场的PPT,一个介绍能够给大家带来一个对这个产业宏观的一个认识,可能有助于大家对整个产业未来发展更加全面的一个了解。

  我的内容分为两个部分。第一,大数据产业的发展情况。第二,云计算产业的发展情况。

  我们看到,我们其实之所以今天有这样大的一场峰会,有这样一个大数据投融资论坛,必然是跟大数据快速发展是非常密切的。我们大概是从2012年开始,我们开始跟踪大数据这个名词所代表的产业。会发现,实际上我们其实去年的大数据峰会做了一个很好的开场,实际上最开始我们认为数据从什么时候开始,可能从有纸的时候开始,或者从最早有甲骨文时候的开始,或者所有能够记载产品信息的都是数据,但是这些数据能不能被利用,如何的被利用呢?直到2016年之后才开始有一个整体的产业的概念,这个产业能够得到非常快速的发展。

  但是,这个技术的应用是起源于互联网的,但是这个产业形成产业化的发展到现在可能经历了五六年的时间。它开始向更广阔的领域来扩展,并且在扩展的这个过程之中,也发现它开始形成新的这样一个产业生态。

  数据来源于哪儿?这是最关键的问题。数据可能来源于比如说个人,数据包括比如个人信息、企业数据、国家数据,它可能来源于,比如说很多的金融、农业、医疗、交通各行各业,也来源于互联网上大家的行为,大家的信息。在这样一个大的数据的逐渐累计的量的情况下,在它具有这种,比如说它的量大、多样、快速、价值密度低这样一个特征下,技术和产业开始呈现,包括衍生出什么呢?就是技术和方案,以及这种服务的供应商,以及向社会其他领域延伸的时候它的应用,比如说我们要做分析,做挖掘,做呈现等等就形成了一个新的业态。

  技术创新来看,大数据的整个技术这几年其实是一个快速发展的,它其实是经历了一个起步和加速奔跑的这样一个阶段。在2010-2015年期间整个技术实际上从技术变成产品,变成实现,到应用里面它有一个很快的过程。总体来理解,大数据的技术,我们把它分为,比如说,在SQL这个阶段,可以认为是前大数据时代,到2000年以后,分布式技术的提出,进入NOSQL阶段,开源的Apache、Hadoop逐渐兴起,大幅度推动互联网大数据的应用。到回归SQL阶段,Skark、Flink等一代融合大数据态、SQL  on、Hadoop兴起。整个趋势来看,底层的技术不断的成熟,对于上层的技术开始释放它的折算一个创新的活力。

  大数据需求拉动技术创新,如果在座有投资者,在初看这个行业的时候可能会面临很多知识性的问题。现在整个来看,我们的技术,比如已经有310多种不同的数据管理的技术,从1980面开始提出SQL,然后2000年左右提出NewSQL,到2010年提出NOSQL,每个技术架层都存在很多新的技术,有Oracle,有IBM,有很多其他家公司的实现和产品。到目前来看,对上采用统一接口,底层使用内层的技术成为一个主要趋势。

  大数据的平台技术,可能从2010年进入一个加速奔跑的阶段,在这个加速奔跑的阶段,这个技术产品的竞争是非常激烈的,到目前认为它进入了一个拼生态的阶段。现在Hadoop产品其实花落谁家基本上还是比较清晰的一个趋势了。前四强基本上现在是比如Cloudera,Hortonworks也在强调它的Hadoop的标准化,技术本身已经在加速奔跑了。

  在大数据分析的技术来看,我们认为它经历的一个过程是从了如指掌到运筹帷幄。了如指掌是指我们能够把这个东西用数据的方法把它描述清楚。到运筹帷幄是我们可以应用数据来决策,2012年大数据这个词刚刚热的时候,一句流行的话,叫“除了上帝,其他都要用数据来说话”。所谓上帝,其实无非就是他们会预测,他们会决策,由于能够依据数据来做决策。现在其实很多的,就是以前预想的一些场景,其实决策技术层已经能够实现了,对于很多大数据公司来说,技术不是门槛,应用是门槛,就是如何能获得大量的、有效的数据能够来做预测,能够来做决策。

  数据分析的工具主要BI工具,主要做描述性的工作,到现在可能更多是数据挖掘性的工具,我们用来制图谱,用来做预测性分析,用来做仿真,用来做优化。

  应用创新,按照PPT所显示的这样一个路径,就是按照技术和数据两条路径在不断深化。从应用来看,最开始实现历史数据的查询,到实现用户行为的分析,到实现精准的营销。对用户有一个精准的判断,对风险可以做到精确的管理。

  这是我们对于大数据生态做的一个分析。左边这张图2012年我们做分析的时候找到的一张度,整个大  数据生态,比如从递增技术,比如像德国其他的一些衍生技术,下面有运营的,有技术的。现在按这样一个结构来看。

  大数据产业也快速增长的,按照狭义的统计口径,现在大概有300亿美元的规模,从全球来看,这样一个预测,不管是欧盟传统的偏保守的地方,以及美国创新的激励,还有中国后起之秀大数据对经济的增长都有很明显的拉动。更多的政策来看,不知道大家有没有一些跟踪,各国在出台密集的政策,比如美国是几类产业发展。其实美国真的很准确的预测到,大数据产业发展的问题什么,就是没有数据,技术可能走的很快。它这个网站刚上线的时候很多政府部门不拿数据出来。他也用了很多鼓励的措施来做这个事情,包括我们后面可以看到,比如大数据的一个研发计划,这个我也看到,他们资助了很多,比如基于各种各样的行业数据做应用,它重新创立了一套政府采购的体系支持研发应用的发展。再往前看,什么是大数据发展的障碍,数据格式是障碍,法律是非常大的障碍,后面会专门分享一下。就是相关的法律隐私的保护等等,它一方面没有这样的一些保证的措施,可能会导致这种产业是乱象发展的,但是如果有这样的措施,又可能导致这个产业被按住了,没有办法发展。

  总结起来来看,各国其实总体的态度都是推动发展的,而欧盟这边其实很多时候它其实是,我觉得保障它有序发展的思路可能更多一点。我们会看到欧盟出一些比如数据港,它的一些隐私保护等等这样的一些法律,但是这些东西对于全球来规范这种数据的发展,数据产业的发展还是非常有帮助的。

  下面分享一下大数据发展所面临的主要问题。从我们现在自己的研究的感受来看,大数据产业目前面临的最大的问题就是我后面要分享的三个问题。本身应用确实比如数据格式,今天上午和昨天的会上有不断有专家在提,说数据格式是一个非常大的问题。它有格式化的数据,这个产业有可能发展,但是更多的这个问题其实它是能够被解决的,但是法律的问题牵扯到的层面非常多。

  首先,个人信息保护会面临很大的挑战,因为这个问题会分很长的链条。每一个链条涉及到很多环节,每一个环节又涉及到很多的比如说这种产业界的各方,政府的各方等等。

  我们看数据的生命周期来看,会体现在比如数据收集、数据分析、数据流转,这样的一些环节。比如数据收集,海量数据进入全面的追踪,这个阶段其实很明显的一个特点,就是它的透明度是很低的,在数据分析这样一个阶段,他可能会深挖这样一个信息。但是,深挖的阶段,大家最明显看到的问题是说,折算一个阶段,这个数据是谁的,这是最模糊的一个阶段,这个数据是我的,还是挖掘方的。在数据浏览的这个阶段,也就是说,现在很多交易所,各地都在做,但是真正的产业是什么样的,我想对这个产业有了解的人都会很清楚。数据流转存在的问题,就是数据出去了,我几乎会它是失控的,虽然也有很多办法,但是这个办法在当前来说基本上效益不太大,所以会面临数据安全,数据的风险等情况。

  第二,数据的跨境流动,其实在大数据之前数据流动就是一个很大的问题,我记得有一个APEC跨境隐私保护规则的体系,就是多国的商务部参与的。但是,那个尽管用了政府很高层的力量去推这个事情,在有限国家内去推数据跨境流动的规则的互认到最后也没有成功。

  其中跨境流动主要有几个方面。比如说,美国TPP协定里面倡导数据自由流动。对欧盟就是一个保守的方法,对于企业有严格的义务,而且对美国政府,对美国企业也有更高的要求。而我国的《网络安全法》去年提出来之后,虽然有很多细则也在等着确定,我们今天上午的法律的那个论坛也是非常非常的火爆,因为对于这个数据法律的各方也都发表了很多思考,很多见解。但是,这里面有一条,比如要求数据的留存,这对企业是一个非常明确的信息,而且这个里面会对企业有很多合规性,这样的一些要求。当然了,如果对法律感兴趣,我们联盟还有一个专门数据的法律的工作组,大家可以通过这个组参与到《网络安全法》下一步细则的制定中。

  另外,数据交易规则的建立。数据交易规则步建立,数据是死的,每个人的数据,或者每个主体的数据只在他这一方流动不起来,实际上非常妨碍这个产业的发展。但是,这个规则面临很多的问题,比如说数据权属,比如用户行为的数据是谁的,数据交易标的,哪些数据可以交易,哪些数据禁止交易等等这些。

  然后,数据资产的评估,数据资产的评估,比如黑市和灰市存在很多数据交易,在这个数据交易,我也曾经听有业界,有人非常认真的跟我开了一个玩笑,说数据交易的时候,通常比如我卖你200条信息,其中他说保证有50条是真的,所以,这个评估其实真的是有难度的。

  另外,比如数据安全的问题,就是在交易过程中不被泄露、窃取、篡改、复制。另外,数据的主体,网信办形成“3+N”的模式,但是监管落在哪个部门,现在还没有来表态,找说监管在工信部,但是工信部目前在简政放权的情况下说出台一个什么样的政策才能有效的关注,这是一个有挑战的问题,而这个管主,会不会管死,就更是一个大的难题了,以上是关于大数据领域的一个分享。

  下面,分享一下云计算的产业情况。云计算可能从2005年可以算它的元年,到现在也有十几年的发展时间了。云计算有一个很典型的特点,叫做规模效应,是它横空出世的时候最初认可的这样一个用法。在这种规模效应下,它强调的马太效应非常明显。全球公有云市场占有率前三甲就是亚马逊、微软、IBM,占据了全球市场的47%。这样一个对比图也可以看到,它在2016年每个业务,比如云业务的流通服务,SaaS、PaaS、IaaS,等等这些方面的一个中小量。

  但是,在这样一个中小量情况下,整体呈现的是平稳增长的一个态势,在未来应该还是处于中速继续放缓的这样一个阶段。但是,它对传统IT领域的替代效应也是无可置疑的态势。

  我国云计算产业经过“十二五”阶段的起步和蓄势的阶段,认为在“十三五”期间能迎来规模发展的情况。但是这个情况也分不同的领域,比如在IaaS领域,IaaS领域,现在很明显我们能够看到是巨头领跑,以及比如三家运营商有它独特的优势,比如政企的传统市场,有它的销售渠道,它的全国网络的这样一个优势。而这种细分市场,已经也基本上被Ucloud、青云、金山等等新兴的云服务企业占据了各自的特色领域。类似于像华为、浪潮、曙光这种IT厂商在向云转型,也是从专有云,基本上属于这三家之首。

  从资本市场的统计,2015、2016年统计到,6笔IaaS相关的融资,集中在5家企业,包括,金山、Ucloud、青云、华云、万国,今天早上Ucloud宣布了它的D轮融资,9.6亿。

  PaaS是比较弱的,它的创新创业应该刚刚开始,但是PaaS有一个很大的问题,它的门槛很高,它的应用在中国一个信息化发展水平不均衡的情况下,其实是一个比较难推广的背景。我们也看到比如新浪的SAE,就是我跟新浪SAE的前后几任领导都很熟,但是还是很遗憾,它没有能够非常好的实现他们当时追赶的梦想。

  SaaS是一个非常百花齐放的态势,所以SaaS从去年开始,比如企业级SaaS移动办公成为了最新的投资热点。这种小而美,小而深,小而精的企业开始出现,也有一些更加深挖或者定制性的机会。

  我们可以看到SaaS的小花,领域也非常多,企业IM,去年钉钉推的力度非常大,比如移动OA,销售管理。比如财务方面,然后商业智能的等等,很多很多的特别有特色的花开始开在这个里面。

  而对于大的企业来说,政务云其实是企业的突破口,我们也非常开心的看到,在信通院和数据中心联盟不懈推动下,去年财政部都已经发了采购云服务的目录。通过这个目录,今年我们会跟各地的采购中心,以及政府采购报,采购部的国库司我们也会继续推动采购云服务这样的一些细项的文件的出台,进一步能够推动各省的政务云,政务上云等等这样一个进程。

  这里有一个统计数据和一个统计上的模式。比如它的部署模式,它的服务模式,它的应用模式,它的这种服务提供商的一个趋势也供各位参考。

  从国际上来看,它的技术方面的热点,从产业上来看,技术发展并没有那么快速。主要的领域在于虚拟化技术,虚拟化技术从虚拟机开始到Docker,然后最新的一些方式来演进。而在云计算和物联网的结合成为了新的方向,所以巨头开始纷纷发布基于IOT,面向IOT的服务。而云安全在产业发展之中成为一个备受瞩目的观点,我们在去年也是发布了联盟的可信云安全评估这样一项专项的评估,通过这个评估,我们也确实发现,因为这个评估是跟CSA联合的,CSA主要关注在管理方面,在技术体系方面,我们发现其实安全这个问题确实是在快速发展的时候它被忽略掉的这样一个问题。像刚才我这儿所列出来的这五项安全威胁,实际上是非常广泛的存在的。

  在政策支持方面,熟悉云计算的领域大家应该比较清楚。主要几个重要的文件,包括像国务院关于云计算创新发展的这样一个文件,在大数据行动纲要里面,其实对云计算也有支持。

  政策这个特点,就是我们有一些统计,比如说,西部地区的这种,以云计算、大数据、互联网技术来带动新兴产业的这样一个应用的态势实际上是一个非常明显的态势。政务云应用示范成为主要的政策抓手,这个全国各地虽然各不相同,但是政府都说我给你用,或者我要买你的,然后作为主要的发展的一些卖点。但是,在具体落地上,还是有需要很多细项的一个措施来能够推动,而且还有一点就是说,我们发展数据中心,发展云计算,发展大数据,发展人工智能,发展VR,最后都变成了发展地产。

  另外,云服务市场的监管。云服务市场的监管,现在确实也看到很多的这种,比如说违规的情况,或者就是现在违规,不是说互联网专业协会业务违规,违规的情况就是安全责任不当,以及有一些走在政策边缘的这样一些情况存在。所以,市场监管在今年里面应该是一个非常加压的一个态势。

中国通信研究院网站数据中心联盟秘书长 孙明俊

  3月28日至29日,由工业和信息化部指导,中国信息通信研究院、中国通信标准化协会主办,数据中心联盟、大数据发展促进委员会承办的“2017大数据产业峰会”将在北京国际会议中心盛大召开。本文来自中国通信研究院网站数据中心联盟秘书长 孙明俊:大数据、云计算等新一代信息产业发展情况。

收藏 举报

延伸 · 阅读