数据流通的2.0 征信和数据流通放在一起

2017-03-30 11:04:39

数据堂副总裁肖永红

  很高兴和大家能有机会来交流数据流通这一件事情,一开始信通院找我的时候分会场有一个论坛让我讲一讲,当时我看了一下我以为老眼昏花,我以为征信和数据流通是两个论坛,一看是一个论坛,为什么这么安排?我想有几个原因,第一个原因确实数据流通这几个词,应该是数据交易比较火,因为我也给他们提了几个意见,交易这个词太敏感或者说这说法本身有问题,客观地讲把这定义为数据流通更准确一些,今天我在想为什么征信和大数据流通论坛,实际上目前整个流通领域来说,我感觉数据变现的出口并不多。它集中有限领域,精准营销、征信,所以把征信和数据流通放在一起是有道理。

  另外反过来讲,我也看到前面有几个嘉宾在讲,他们对数据的需求是很大,为什么把这两个事情融在一块原因,所以我今天讲的话就是数据流通的2.0,实际上在前几年从大数据概念出来,差不多过了几年疯狂得出来各种大数据交易所,包括什么交易平台,再到后来我们提出数据流通,实际上整个数据流通的阶段,就是我自己的感觉目前已经走到了从粗放型1.0走到了2.0,什么是1.0、什么是2.0给大家介绍一下,先说整个大数据产业生态,或者说整个大数据产业的背景和数据流通的关系,现在大家看一下大数据产业产业图谱和产业地图是一个圆形的靶子这么一个状态,包括数据源现在看一下分了一二三四环,实际上就是整个大数据产业从2011年出来,在中国差不多走了将近5到6年的历程,整个大数据产业生态分工越来越明细化,我们看到专门做数据可视化,专门做一些数据的底层的工具,专门做一些EI设计方案,甚至专门在一个医疗、农业各个领域大数据解决方案,我们可以看到整个大数据产业生态目前已经初具雏形。实际上看起来很美好,但是实际上我感觉第一个大数据产业目前还是在社会主义的初级阶段,并没有真正到大数据爆发的那个时期。原来我们经常看美国人会出一个新兴产业有一个发展的曲线图,往往这产业新出来一个东西,它和现在的概念上先去炒,就是说我去贵阳,一个面馆的老板娘也知道大数据,但是她不知道大数据真正的概念,但是知道大概做什么事情?可能每一个产业都要经历这一个阶段,我自己目前定义还是在初级阶段,这初级阶段的特征就是说虽然我们刚才看到了一个相对明细的半途什么基层、架构层、可视化和科工具层,但是我是在混沌中诸侯跑马圈地的状态,其实大的版图并没有定下来,就是我们经常搞数据源看了人家大数据应用赚钱,做大数据的应用看了那一帮数据交易赚钱,坐在那倒腾倒腾就赚钱,另外数据应用看那一帮坐着我们辛苦半天还是搞云计算和数据机房那一帮人赚钱,就是这里面整个产业里面都是看对方那碗里那一点东西,就是整个大数据体量没到那么大,其实目前来说还是有限,所以这就造成一种局面,A想干点B的事情,B想干点C的事情,C返回来想干A五的事情,所以这里面我给定义跑马圈地版图并没有定下来,这是目前大数据的状态。

  回到我们今天的主题数据流通,就是我们一方面确实感觉整个从大数据的概念出来以后,再经过这么几年的发展,我们真的感觉我们所能接触到和所能感受到和所能看到的数据越来越多、电商数据、搜索数据、银联刷卡、我们运营商的数据,包括APP的行为数据,你的数据确实越来越多了,而且我们最近看到政府频繁的发生,我们要把政府的各个部门的数据去公开,也去共享,也去开放。一方面我们确实感到数据多了,另一方面数据使用者和数据需求方他们感觉真的很难拿到,或者是拿到的质量很差,或者说只能起一个杯水车薪的作用。

  所以对整个大数据产业来说,要想把这产业做大,解决数据源还是一个核心问题,因为底层数据不流通的话,你的好多数据分析你就无从谈起,这确实是一个根本的问题。 所以我给它总结六个字很重要、很尴尬,这是目前数据流通的一个状态。

  第二个现象就是整个数据流通的领域就是大户,我所说的大户就是那些拥有真正的核心的大叔据资源那些机构,比如说BAT,百度有大量的用户,体现用户意图的搜索行为的数据。阿里掌握了大量大家在电商平台上交易或者说你喜欢那个商品你在那停留多长时间,你经常大概花费多少钱电商的数据,腾讯的话毫无疑问掌握了大家现在基本上人与人之间的关系,包括你的社交平台上行为的数据,这一个我定义为大数据圈拥有数据源的大户,甚至包括三大运营商,包括银联,包括还有一些政府部门。它们实际上是这个圈的大户。但是对这一些大户来说目前整个数据源开放和数据流通是相对比较谨慎。这里面有几个原因,第一个原因就是这一些大户自己很容易产生商业模式,我不需要别人的数据,我暂时甚至不和别人去关联融汇,我自己也可以商业模式出来。第二个原因特别是像运营商政府部门拥有海量的数据的机构,因为它涉及到政府监管的部门,他们在对数据开放和流通使用的时候实际上比较谨慎,当然这步伐在迈但是比较谨慎。另外一个词就是散户横行,我们在面上的市场甚至包括面下的各种各样的市场你会发现各种各样的数据交易,包括我最近接触过很多WIFI热点很多线下用户在某一个商场去停留多长时间,去哪个商店看了什么东西,就是很多拥有这种小型数据源的机构反倒是很灵活,尽管他们商业模式我看了半天我没看明白他们也是在寻求看看业务中产生的数据驱变现,他们很积极很灵活的跑这一些事情,所以这个也是目前整个数据流通市场的现象。

  再回顾整个国内数据流通的历程,我把它总结了几个版本,第一个版本叫共享阶段是0.5的版本,实际上数据流通和数据交易这个词并不是新鲜词,实际上国家科技部包括财政部若干年前,应该差不多在2000几年,到2010年,国家是科学数学层面,已经推了若干个数学共享工具的平台,实际上我们理解为0.5的阶段,这一个阶段有一个特征很多的共享平台是由国家发起,而且它的商业性没那么强,它真的想把国家投入的在一些科研项目上投入的钱和产出的数据共享出来,这个我理解是最早的国内共享这么一个阶段。再到后来的话,我们后来会看到各种各样的交易平台,包括各种的交易所,我把它定义为1.0的阶段,这阶段主要是满足大数据产业最原始和最底层的数据需求,我把它定义为1.0,在这阶段的话,就是以交易原始数据为主,在这阶段的一个特色就是落霞与孤鹜齐非、秋水共长天一色。你也可以看到很多小型的数据在线下交易,这里面是鱼龙混杂的状态,这是数据1.0的状态。

  但是1.0的阶段它毕竟还是满足早期的一些大家对数据源的需要,随着我们在和客户接触的过程中,包括我们和很多的数据需求方,使用的数据过程中,你会发现用户用数据慢慢它的需求是变化,在最开始没数据时候,或者没饭吃的时候给他一个饼他就会很满足,但是它一旦满足到一定程度吃饱就是满汉全席或者想吃海鲜,在这时候提供原始的数据就会碰到一些问题,这里面当然有两个因素,我们分析,一个就是刚才就是一定程度上毕竟我们返过来讲,这几年国内的数据流通市场,我觉得还是解决了一定的问题,它会满足一部分用户需求,但是有一些用户它在基本需求得到满足以后,它会期望更高,就是这种我们要判断用户的需求,这里面我想的是我们经常碰到的一个状态,就是说很多时候用户要的不是数据,当然今天来的我相信台下大部分人都具备一定的数据分析或者数据挖掘的能力。但是我们现在谈到很多传统的或者是一些非高科技的行业客户,他们也想用数据的时候,但是他们实际上使用数据的能力是不足的。这个时候它希望你把数据再做成半成品,甚至是一个完整的解决方案去把它解决一个问题。这时候就不是靠单纯的数据交易来解决的一个问题了。

  所以我在总结1.0的数据交易,其实目前来说能解决一些问题,但是慢慢就解决不了根本的问我们需要把数据转化为低门槛的服务,是目前我们需要在做的一件事情。

  这还是延续我刚才的观点,从赤果果的交易到多层次服务,我们经常学交易都知道,人民日益增长的物质文化同落后的社会生产力的矛盾,很多人一伸手更高阶的东西,在这时候就不能说有一堆原始数据你去玩吧,你玩不了。这时候多做一些工作,就是把这一些数据加工一下提供出去,这样的话我们就可以满足不同层次的数据需求方,再换个不太形象的例子,就是我们原来可能提供是一个小麦,把这些小麦给你们你自己爱怎么玩玩去,现在不行,我要小麦+面粉,可能有的人就说饺子粉、蛋糕粉,这时候提供小麦不同的面粉再道不同面粉层次之间的产品所要提供的,这个就是我可能从1.0到2.0要干的事情。

  当然具体的形式上,其实刚才几位嘉宾都讲了,还有国内的数据服务商也在提供一些数据,就是说我们未来提供数据要像提供自来水一样提供。这怎么理解?你不能包一个数据包给他们,这里面分装成STI,或者是分装成某一个流性的接口提供给它,就像我们家里面用自来水基本上不用考虑这个水来自于密云水库还是来自于南水北调,你基本上打开水龙头就可以喝,你也不用担心哪个北京自来水厂做了清洗。所以未来对于数据使用方来说应该像使用自来水一样去使用数据,不用关心数据源来自于哪?来自于中国移动百度不用关心,他只要数据怎么用去产生价值就可以了,这可能是未来我们希望达到的一个方式。

  第三个就是我刚才一开始讲了,其实整个数据流通它的本质上是想让数据变现,但目前来说,整个大数据产业实际上数据的变现出口并不多,征信是一个,包括金融风控,包括精准营销人工智能是一个,但是除此之外其他的领域目前我还没看到很好的数据变现模式,就是说你这数据粉状成商业模式以后,很快有终端的用户去使用,把这数据价值出现出来,这也还是比较有限,这也是当前数据流通,其实看起来比较艰难的状态,就是因为出口不多,甚至就是说这一块产生的经济效益不多,怎么样让它流通起来,当然这里面鸡生蛋还有鸡生鸡的原因,是是供应更多了以后,是不是促进出口增多了以后,这也不好说。所以我们现在再要做的一个事情对数据流通做更多的事情。除了金融征信应用、精准营销等等,在工业大数据、农业领域能快速找到成熟看起来爆发的商业模式。尤其是目前整个数据流通面临的问题,当然这问题不是数据流通单单能解决的问题,它是整个大数据产业链的问题,它是一个整体的问题。

  第四个就是数据流通过程中数据定价的问题,实际上目前数据定价我个人感觉没必要搞什么标准规范,因为现在还是在战国混乱的阶段,你搞一些标准的定价,就是说没有什么太多的用处。目前的状态是什么?就是整个数据流通是数据源还是太少,而不是太多,而要数据的人其实很多,所以返过来卖方市场,但是目前来说有数据的是老大,但是这定价目前来看的话,它是一个多方,卖方占优,但是多方合一的过程,这里面涉及到数据应用方,包括第三方的数据平台服务方,包括还有数据需求方,现在当然就是工信部包括国家一些层面,也会想来约束和规范,确实这里面存在了一些问题,包括市场监管,这样的话相当于和市场有一个博弈,最终找到一个平衡,这是目前数据定价的状态。但是目前来说整个数据产品的定价是处于一种非常随意和没有太标准和规范的阶段,这是整个流通过程中的数据定价。

  倒数第二张片子,我刚才快速从数据流通对整个大数据产业发展的阶段定义,以及我们对整个数据流通发展的三个阶段的一个介绍。最后来说整个数据流通的趋势,我的感觉就是从精英狂欢到广场群舞,一开始我们可以看到整个大数据的产业玩的比较好就是BAT拥有数据包括像运营商之类,他们天然有大数据的优势,但是随着数据流通和数据交易以及这种数据征信流动起来以后,你会发现参与到里面的玩家会越来越多,所以我总结了一句话从精英狂欢到广场群舞,这涉及到越来越多,大家都可以进来玩。

  最后一个小结就是说我们今天讲了数据流通,这是我个人的定义,从0.5单纯的数据共享的阶段,其实这阶段它的商业兴没那么强,更多的是从国家的工艺角度开放出来,再到1.0的阶段就是原始的交易,大家买卖数据、买卖原始的数据,买卖数据包去满足一些基本的需求,但是随着这几年大家对数据的需求层次不一样,我们刚才讲到人民群众日益增长的物质文化发生矛盾了,这时候需要一些数据源包括一些第三方的数据流通方提供更丰富的数据产品,这个我们定义为2.0的阶段。用文字表述从共享交易到数据服务、从交易原油到加油服务,这也是和我刚才讲到的你将来提供数据就是为它提供一个水管或者加油管道你让它直接调用就可以。第三个就是说数据流通不是独立存在的事情,比如说我们有没有这种可能性,就是说数据流通这领域任何条件大家的交易非常活跃,但是你在数据应用发现没什么产生重量级的商业模式和产品出来,这是不大符合逻辑的,这个产业一定是一个生态,就是说数据流通只是下面一环,那么这个环节,数据流通这市场要想玩的好一定有上面数据应用释放出来,所以最后一句话场景化应用才能最终释放数据流通最大价值的点,就是说这个在各种各样的场景化应用出不来,或者是商业模式出不来,数据流通这个事情一定出不来,或者一定做不大,这是我的一个观点。

  3月28日至29日,由工业和信息化部指导,中国信息通信研究院、中国通信标准化协会主办,数据中心联盟、大数据发展促进委员会承办的“2017大数据产业峰会”将在北京国际会议中心盛大召开。本文来自中国通信研究院网站数据堂副总裁肖永红:数据流通的2.0

  

收藏 举报

延伸 · 阅读