中国大数据第一人涂子沛说:2010年代的中国,农业文明、工业文明和信息文明“三元并存”。栖身于城市立交桥底的农民工拿着智能手机、卖包子的小摊主也有二维码支付、农业大省也必须上马云平台,这种交错、混搭,是一种独特的视觉冲击。

面对大数据,相较于各种制度较为健全的美国,其利用大数据更多着眼于优化,而我国的现状,更多是变革或者说颠覆性质。面对经济艰难的2016年,各行业的逐步萧条似乎更加容易暴露由于原来经济高速发展掩盖的各类社会问题,类似和颐酒店这类安全问题似乎并非孤例。

社会问题考验政府治理能力,在信息化时代,预防、追踪、解决社会问题成为政府利用大数据最好的武器。作为数据银行理念的倡导者和践行者——数据堂,一直关注和思考联合其他数据服务于政府治理。不得不说,政府治理涉及的数据种类众多,数据维度丰富,数据更新速度快,价值高等特性,是当下考验一家大数据企业和政府数据共享的绝佳试验项目。

维稳事件日益凸显

利率市场化引发的低利率时代使得民间资本涌出,这些资本原是有利于社会经济结构协调发展的,也受到国家支持。但这一机会被别有用心之人趁火打劫。所以我们看到很多P2P跑路、倒闭现象,于是出现民众维权、政府维稳的事件日益增多。怎样识别老赖,不仅是投资者教育的问题,更是政府当前面临的棘手问题。

偷税漏税屡禁不绝

在我国,偷税漏税屡禁不止,指望人人承担企业家责任似乎不切实际,但作为政府应该手握一把“照妖镜”。税务是财政收入主体,是政府运作的基础,兹事体大,对偷税漏税的企业及个人能够及时发现,预警,采取措施,是新时期考验政府执政能力的重要指标。

家庭信用亟待解决

在一个有着数千年“仁义礼智信”道德根基的国家,却时刻上演着违反道德标尺的戏码,老人假摔、碰瓷时刻挑战人性底线。几个老人讹诈的事例坏了一锅汤,剩下九十几个老人摔倒无人扶,没人扶主要原因是怕连累自己,暂不说扶起之后会不会被讹,就说送到医院怎么办,谁出钱?治不治?面对这类社会问题,有没有两全其美之策?

恐怖事件日益猖獗

反恐已经越来越不是话题,而是随时可能在你我身边上演的真实血案。作为公民,有义务举报任何与恐怖有关的蛛丝马迹,但公民毕竟没有武装力量,真正还需依靠政府力量,政府面对恐怖活动,究竟如何及早发现并有效制止?

政府大数据能做什么

既然提出上述社会问题,就要寻找解决途径。钥匙就埋在政府大数据这个金矿里。这里谈的政府大数据是广义上的,包含国企大数据,比如银行、民航、电力、电信、自来水等企业数据;此外,还有交通、医疗、教育、工商、公安、法院、税务、社保、住建等政府行政部门数据。这些数据汇集到数据银行,通过数据银行管理运营,可针对不同的应用场景提供不同的解决方案。

大数据维稳

比如在大数据维稳案例中,针对某金融公司日常经营活动,可以实时调用该企业银行、通信、电力、自来水等相关数据进行企业经营状况评估,一旦发现数据急遽变化,便可发出预警,从而提前作出判断,进而采取相关措施。

大数据防偷税漏税

大数据建立家庭信用卡

对于独居老人的案例,可以利用户籍、银行、社保、住建、消费等数据构建公民家庭信用保障体系,制作出家庭信用卡或者市民卡,卡上有老人家庭各方面数据,有助于帮扶人群和医疗机构采取有效核查并提供及时救助。

大数据反恐

针对大数据反恐,政府大数据平台通过整合分析交通、宾馆、通信、户籍、危险品销售等数据排查出一个地区某些人群的相关危险信息,这些信息及时输送到相关部门及早采取针对性措施。美国大数据公司Palantir以此查出本拉登信息就是大数据反恐的鼻祖案例。

政府大数据价值空间

政府掌控的数据涉及国计民生方方面面,这些数据除了政府治理改善民生服务外,还可以创造难以预估的商业价值。当前金融征信、人工智能、医疗健康、智慧交通等等领域都需要接入政府数据以满足其商业应用需求。

据麦肯锡统计,交通、教育、医疗健康等行业的全球数据开放可创造3.2万亿到5.4万亿美元的经济价值。据IDC预测,全球大数据市场年增长率高达40%,在2017年将达到530亿美元。易观国际预测,中国政府大数据应用市场规模将在2020年达574亿元。

政府大数据运营解决方案

《大数据发展纲要》标志大数据国家战略形成,其中,数据开放、共享与安全是三大重点工程。目前政府数据公开实施困难,进展缓慢,究其主因,主要是没有成功机制借鉴,缺乏动力,深层原因是缺乏大数据系统规划和深入挖掘数据价值的能力。

数据堂在大数据领域拥有五年数据采集、处理、交易和API服务方面技术和经验,以数据众包采集平台和数据处理技术实力获取中关村国家自主创新荣誉资质。数据堂政府大数据运营解决方案总体分四步走战略,第一步搭建政府大数据运营平台,第二步收集汇总数据,第三步引入数据价值评估机制制定数据价格,第四步挖掘对接商业应用价值。这四步走构成数据银行的运营轨迹。

在搭建平台方面,需要考虑的是,对是否建立智慧城市的地方政府又分两种模式,没有建立智慧城市的可以直接搭建大数据平台,避免基础设施重复建设;已建立智慧城市也存在智慧城市平台有数据的和没有数据两种情况,有数据的可以通过智慧城市平台直接对接大数据平台,没有数据由大数据平台对接相应城市委办局解决数据收集问题。

收集过来的数据,需要进行数据处理、清洗、结构化和关联。通过这道程序,解决数据隐私问题,去除敏感信息。进而得到数据评估部门的数据价格制定,通过数据定价,数据成品即可服务于商业化应用。

以金融征信大数据为例

从政府反馈的信息看,金融征信成为政府大数据商业开发与应用最紧迫需求。由于近年金融业大发展,具有较强的经济实力及内需动力;另外,金融业同样遇到瓶颈,征信体系作为金融业基础,其建立迫在眉睫。所以政府大数据运营可以以金融征信大数据作为试点工程切入。

由于我国征信体系建立不完善,留给大数据的空间异常大。大数据征信核心是从数据广度上将权重加在借款人日常生活的交易数据及社交数据上,比如借款人一般都在哪里消费,月均消费金额是多少,消费支出中的分布情况如何,社交圈活跃度如何等诸如此类的问题。这类数据具有很好的连贯性,可以从中分析很多的用户特性,习惯并反向推断借款人的实际财务状况,进行风险筛选;也能大幅增加借款人的违约成本从而警示借款人遵守规则、按期还款。最重要的是,这些数据造假可能性非常低,因为都是大数据环境下的各类碎片信息收集和分析,真实性甚至可以做到百分之百。

经过4年积累,数据堂聚集了大量征信数据集,建立了大数据征信查询平台,针对个人信用和企业信用客户,金融机构可以借此平台快速查询借款人或企业信用评估信息,提高审核效率,降低人工核查成本。