大数据环境下的数据利用规则——以OPEN API为例

2017-03-29 13:46:53

   我今天的题目是大数据环境下的利用规则,以OPEN API为准。刚才各位老师讲了,尤其是大数据对我们的重要性。我今天从四个方向,比如数据和商业数据的定义,以及OPEN API的数据利用规则,以及脉脉不正当竞争案的思考,还有一些数据利用的建议。

  其实之前各位老师和专家也讲到的什么是数据,对于我们来说数据应该是很多样的,像之前我们所说的黄页也好,我们自己记的笔记都是属于。但是现在为什么大数据时代,我们更关注?就是信息技术的突破性发展。我们之前讲到的开发海量的数据进行有效的分析,同时得到商业化的内容。这个时候我们说数据才具有更多商业价值的属性。这个时候,无论是互联网公司还是企业也好,甚至之前的运营商也好,它们才会认为数据有更多的商业价值。大家看到数据的定义,未来的新石油是奥巴马政府提出来的,它已经把大数据上升到国家战略层面,无论是美国还是我们国家,都把大数据整个发展和规制提到日程上来。我们自己也看到,大数据到底是什么样的内容,里面可能更多的关注到个人隐私,像公平。

  之前大家也在讲,说数据到底应该归谁?其实无论是之前的各位专家讲到的,数据从相关的属性,我们自己从产业的角度有一些反思。之前有人提到过,数据因为涉及到个人信息、个人隐私,肯定有人身权的属性,可能被商业化还有财产性的属性,基于这种属性的二元论,大家提到是不是和知识产权很像?是不是放到知识产权里?尤其是个人信息权益相关的法律规定。也有产业界的人提出来是不是形成新的权利?其实针对我们自己的想法,性质实际上和具体的信息、具体数据是有差别的。有些数据的性质不同,权属也不同。像我们所说的,数据的类型、形式,有些是公共属性。像天气信息,在近十年的天气信息是不是有效的商业属性?依然是有效的商业属性,但是它的权属怎么样?我们的个人信息到底怎么样,这个都是值得讨论的。数据应该归谁?应该和平台的责任一样,是进行区分的。这个区分要看数据的划分,才能有一定的稳定性。

  回到今天讲的OPEN API这个例子,OPEN API是针对于我们,尤其是移动互联时代提出的新的接口。我们说API实际上为了有些移动应用在使用过程中获取数据,以让信息沟通方便,由数据开放平台提供API的接口,一些开发者能够有效的出去。这里面有各方的主体,像我们说的信息来源,大多数情况下都是用户,当然也不排除大数据的交易平台。同时,数据的平台方,平台方是以微博为例,社交媒体平台,这里可能有一些UGC的内容,个人信息的地理标识,以及喜好,甚至相关的职业信息和教育信息,这些都是属于平台方自己的数据。同时,我们说数据利用方,各方的移动APP应用,他们通过OPEN API的一些协议,获得相关的数据接口,实际上也是达到了数据导流的方式。这个时候有效的解决数据应用的冷启动问题,有些数据平台上的用户,通过OPEN API的协议获得了新的应用的适用。

  我们所说的脉脉软件被诉不正当竞争案就是基于OPEN API。我们看一下脉脉诉不正当竞争案的事情。脉脉其实是我们曾经的一个第三方应用软件的合作方,但是微梦公司是微博的实际运营方,在合作过程中发现,脉脉的注册用户大量的存在注册用户和非注册用户混用的形象,比如直接使用了新浪微博的用户头像、名称和职业信息,这个具有很明显的指向性,被认为可能存在侵犯用户个人相关隐私的情况。最后我们考虑到现有的法律制度,提起了不正当竞争。在2016年12月30日年底宣判,这个案子被认为大数据时代针对个人信息和用户信息保护的实案。

  针对这个案子,我们有一些启示。第一个,对于数据属性的认定。通过司法案例确认一个数据信息是重要的商业资源,像我之前给大家介绍的一样,它在未来被定义为新石油,对于各个公司的商业价值不言而喻。用户信息是提升企业竞争力的基础和核心,对于数据的应用,对于个人用户信息的滥用,到底通过什么样的方式进行保护?这个是通过微梦诉脉脉的案子得到了一定的确认。同时明确了互联网中用户信息的基本原则,用户明示同意和最少够用的原则,在这个情况下对于搜集用户信息形成相关的数据流以及数据库,后续再进行商业化利用,这个应该是大数据应用或者大数据时代里面平台所承担的基本商业道德和原则。第三点,这是非常有意思的地方,叫做三重模式。之前各位老师也提到了,用户授权+平台授权,再回到用户授权。第三方应用在获得相关信息的时候,最初有用户授权才能通过API的接口,但是API又与平台签订了OPEN API的协议,这个时候已经拿到了用户的初步授权和平台授权,但是它在进行商业化的时候依然需要用户进行再确认,这个目的就是通过三重授权的模式得到有效的规制,同时又明示用户的义务。脉脉这个应用就是恰恰没有通过用户的再授权,导致了不正当竞争的行为,也就构成了侵权。

  此外,我们确定了网络平台提供方的合法商业化数据的提起诉权的主张权利。我们可以看到,无论是数据也好,还是个人信息也好,对于数据来说,可能现在的权属还比较模糊,到底它是什么样性质的权利,大家依然没有确定,这个时候提起诉讼,或者通过司法手段保障自己的权利,还存在着一定的障碍。这个时候,通过个人信息保护,个人信息保护法正在进行立法的进程当中,这个时候通过不正当竞争的手段,由网络平台提供方提起针对商业化数据的保护主张是非常必要,而且具有一定的示范意义的。

  通过这个案例,我们总结了几个利用规则。利用规则主要有五个方面。这五个方面,应该是平台或者是商业数据利用的基本规则。

  第一,合法、正当、必要。我们讲你在利用数据的过程中,首先正当性以及我们所说的必要性,之前提到的最少够用原则。然后合法来源,你通过非法手段获取的相关信息,比如说像抓取,比如被盗的非法抓取,你的商业数据本身就存在瑕疵,在后续的商业化利用就会存在障碍。

  第二,安全保障原则。你在作为数据平台的过程中,其实具有一定的义务,你一定要对自己所收集到的数据信息起到安全保障作用。之前提到的旅游网站形成了用户信息的泄露,它没有尽到足够的安全保护的作用。

  第三,用户告知及授权。因为在合作过程中,要通过用户的明示得到使用或者商业再利用的方式,这个时候用户如果说没有经过告知和授权,你这个时候就没有得到正当合法的源头。

  第四,公平、合理、有序。这是我们在未来过程中,我们也认识到整个大数据行业的发展,其实由于它商业的属性和商业价值,其实各家的主体,无论是传统运营商,现在的互联网媒体、平台,以及各家电商企业都会意识到,充分地挖掘商业属性,但是这个时候一个有效的、公平、有序的行业竞争秩序也是非常有必要的。这是我们经常讲的要提供一个好的平台,设立一个行之有效的标准。这个标准才更好地,更有利的促进我们所说的大数据行业的发展。

  最后,防止数据滥用。因为我们一直以来都存在一个困惑或者存在一个博弈,或者利益考量的方式。我们怎么样提供数据,如果数据脱敏到形成一张白纸,这个时候商业价值是非常有限的。但是如果没有进行脱敏,这个时候实际上是对于用户也好,或者数据也好也构成了一定的侵害。这个时候数据滥用的尺度和数据滥用的相关范围,这个是需要明确的。基于利用规则,比如说如何有效的防止数据滥用就和上面的四个原则结合起来一起适用,才能保障数据既可能实现商业化的价值,同时又有利于保护相关的各方主体的权益。

  针对于数据利用的思考,提供四个方向。

  第一,加强立法建设工作。像我们说的,无论是数据利用,还是个人信息范围都是一直处于比较模糊的状态,无论是立法工作还是行业指导规范,像中国信息通信研究院和互联网协会都作出了非常好的榜样,也引导行业能够有利的参与其中,形成行业的标准或者主流意见。

  同时,作为企业在实践过程中,我们也看到有一些黑产业,我们所说的黑产业,比如有些针对于非法数据的倒卖,针对非法数据的再次利用,甚至我们经常发现以微博为例,经常会有一些私信把微博所有的数据形成过来分析你,这都是一个黑产业的表现形式,而且这种不规范的使用,其实对于整个行业,对于整个数据,甚至对于平台都是非常不利的。这个时候,我们说作执法上怎么样进行黑产业的有效打击,这也是我们作为企业非常关注的问题。

  然后呼吁建立一个数据追溯机制,很好的解决合法和有效来源的问题。即使你这个里面合法有效来源是安全的,这个时候你在往上追的时候,形成了倒逼的追责机制,有效避免了黑产业和非法数据利用的源头。接下来是首选平台方对于数据的主体角色。平台方也好,还是数据方,在数据使用中对于数据的商业价值都参与了整个建设工作,这个时候对于数据的保护也好,对于数据的使用利用也好,其实平台方更有主体便利性。

新浪网高级法律顾问王磊

   3月28日至29日,由工业和信息化部指导,中国信息通信研究院、中国通信标准化协会主办,数据中心联盟、大数据发展促进委员会承办的“2017大数据产业峰会”将在北京国际会议中心盛大召开。本文来自中国通信研究院网站新浪网高级法律顾问王磊:大数据环境下的数据利用规则——以OPEN API为例

收藏 举报

延伸 · 阅读