行业新闻 网站公告

标准不统一共享机制不合理 难谈大数据

来源:网贷之家作者:尔朱吾癸

日前,《促进大数据发展行动纲要》(下称《纲要》)正式印发,三年建平台五年内逐步实现政府数据开放,国家立场明确现实意义重大,业内外人士就其积极意义均表示一致认同。

然而,如何建立政府数据开放平台?促进大数据发展的背后又有怎样的难点?对此,盈灿集团副总裁、网贷之家CEO石鹏峰坦言:“在中国谈论大数据,最大的问题不在于中国的建模能力、算法等,目前最大的问题在于数据源的相互割裂、不同数据源之间缺乏共享机制以及统一的存储和应用标准等方面。”

三年建平台五年开放 彰显政府决心

《纲要》显示,在未来10-15年逐步实现以下目标:2017年底前形成跨部门数据资源共享共用格局;2018年底前建成国家政府数据统一开放平台。

“把时间限定到3年,显示出政府对于数据开放平台的重视,背后彰显的是对中国加快推动‘互联网+’的决心。”盈灿集团副总裁、融之家CEO张建梁强调:“从数据原材料、生产加工、消费都能够正向闭环于互联网中,无疑利好互联网,尤其是互联网金融。

对于政府的决心,石鹏峰表示了认同,并补充道,对于这次《行动纲要》的印发,结合年初对个人征信领域的开放,毫无疑问,征信行业会成为最大的受益者。而且此次纲要

多次提到各个领域的数据,也是将信用放在第一位。

“作为网贷行业一大重要基础——征信来说,各类数据的开放与共享是其最重要的基石。有了这些各个维度的开放数据,并且有一个统一的数据标准,才能进行所谓建模、大数据挖掘等应用层面的工作。”石鹏峰表示。

对此,信而富首席风险官吕宇良坦言:“政府数据统一开放平台的建立将为信而富提供丰富的信息来源,便于我们充分发挥在大数据算法和量化驱动风险管理方面的技术优势,从大量数据中挖掘有价值的信息,降低征信成本,从而更好地为尽可能多的民众提供更优惠、便捷的普惠金融服务。”

政策催化下 直击大数据痛点

正如美国政府曾指出,数据是一项有价值的国家资本,应对公众开放,而不是把其禁锢在政府体制内。

诚然,政府数据逐步开放确实是一重大利好,然而,石鹏峰担忧道,在中国谈论大数据,最大的问题不在于中国的建模能力、算法等方面,目前最大的问题在于数据源的相互割裂、不同数据源之间缺乏共享机制以及统一的存储、应用标准。

“其一,数据存储结构标准不统一,增加了多方数据结合使用的难度;其二,数据的共享机制不明确:是直接开放共享?还是由专门一个部门来统一汇集大家的数据然后再共享?而这两种方案都可能存在不少问题。且不说并不是所有数据都可以直接开放共享,就是把所有数据都汇聚起来的难度、成本和风险也极高,同时不同的部门机构之间也存在意愿不统一、不公平的问题。”石鹏峰分析道。

另外,张建梁补充道:“利益问题和安全问题也是难点。就利益方面,数据就是信息,信息就有价值,价值就有利益,拥有这些大数据的部门本身就能够基于这些大数据在所在行业内形成权威和影响力,并直接受益,如果让大数据跨部门共享,那么如何交换,如何共享,可能还是需要一个定价机制去解决。

“而安全方面,无论是政府机构还是互联网公司的个别数据都非常敏感,一经泄露都会有很大的社会影响,在倡导开放共享的同时,如何有效控制数据内容安全、传输存储安全等,也是一个很重要的课题。”张建梁如是表示。

“去中心化”或成大数据共享机制的解决方案

没有解决不了的问题,只有解决不了问题的人。

对于上述难点,吕宇良坦言,可从三个方面入手:其一,随着改革的进一步深化、国家顶层设计和统筹规划的推进完善,原有的利益藩篱会被逐渐打破,相关主体只能顺应数据互联互通、信息共享这一总体趋势;其二,随着市场在资源配置中发挥日益重要的作用,各利益主体也有动力开放数据、共享信息;其三,随着大数据理念的普及,数据清理技术手段能帮助改善数据质量。

而就数据共享机制不明确问题的解决方案,石鹏峰用P2P网贷行业的征信数据统一汇集的情况举例道:“大量平台出于信任和公平的原因,不愿意拿出自己的数据共享给第三方汇聚机构,且不说其他原因,针对上述两点,盈灿集团旗下的蜜蜂数据提出了‘peer to peer去中心化’的理念,旨在通过建立不同数据源之间的标准化连接,不直接存储数据源的所有数据,既达到了数据可获取可应用的目的,又解决了平台分享意愿问题。”

石鹏峰坚信这一方式不仅可以在P2P行业相关数据分享领域应用,也可以作为整个大数据共享机制的解决方案。

3年内建立数据开放平台是有可能的,但是一个真正意义上的大数据建设可能是10年、20年甚至更久。”知名网贷人火锅表示。

诚然,或许达成最终目标不止三五年,或许最终解决方案超乎所有人预期,但是在可期的未来,大数据实惠终将实现“全民化”。正如吕宇良所言:“ 如果说上一轮互联网革命让世界变得更小,本轮即将迎来的大数据革命将让世界变得更聪明。”