12月1日下午,由上海大数据联盟、数据猿主办的第20期魔方大数据在上海宝华万豪酒店成功举办。本期魔方大数据以“政务大数据”为主题,邀请了技术方和产业方大咖共聚一堂,共同探讨了政务大数据落地实施的有效路径。本文是数据猿整理“SODA理事会理事、苏打数据CEO高丰”的发言实录
作者| 高丰
官网 | www.datayuan.cn
微信公众号ID | datayuancn
12月1日下午,由上海大数据联盟、数据猿主办的第20期魔方大数据在上海宝华万豪酒店成功举办。本期魔方大数据以“政务大数据”为主题,邀请了技术方和产业方大咖共聚一堂,共同探讨了政务大数据落地实施的有效路径。
以下是数据猿整理“SODA理事会理事、苏打数据CEO高丰”的发言实录:
在进入正题前,我想说一下大数据发展的背景。我们经常会说大数据是石油,是一种资源。后来我们也说大数据是一种资产、是孕育价值的土壤。英国开放数据研究院则说数据像公路,是社会的一种基础设施,具有公共属性,以公共属性来服务于不同形态的创新和发展。所以我们考虑SODA这个项目、考虑开放数据,更多是从数据是一种公共基础设施这个角度出发,以此探讨数据做好服务,帮助不同的企业和机构创新。
这个光谱是英国开放数据院做的,从左端到右端是数据流通的不同形态。最左端是数据完全封闭的状态,如国家安全秘密或者个人隐私数据。光谱最右端是完全开放,如面向所有人公开的开放数据。在开放和封闭之间叫共享,用一个比较宽泛的词是流通。开放数据更多情况还是基于公开的数据,加上一个开放协议。开放协议区分了开放数据和流通数据,它允许别人自由使用和分享数据。开放协议是一个权利保障,是开放数据的核心的所在。
公开解决的是信息访问问题,开放解决的是使用问题,退一步看,流通解决的也是使用问题,把数据从不能够使用的资源变成可以使用的资源。
在数据开放和流通方面不仅上海甚至中国乃至全球都存在两个共性问题:
第一,缺乏动力。掌握数据的政府部门或者相关公共企业,为什么要开放数据?开放数据有什么好处?
第二,应用匮乏。动力和应用是一个因果关系,因为政府等部门不知道开放什么数据,所以即使开放了数据也不能满足市场需要,创造不了价值。
2015年我们开始做SODA,音译过来是苏打,苏打有一个深刻的寓意,打开苏打水的瓶盖后,“砰”一下会冒出许多气泡,这就像数据一样,一旦流通起来,会看到 “砰”一下这样的效果。这样的效果可以通过众创众包的形式实现,所以我们做了这样一个尝试,2015年我们和上海交通委做了交通选题大赛,把上海交通一卡通三个月的数据,强生出租车的数据,浦东公交车的数据提供给参赛者。
2016年我们做了城市安全大赛,带动了公安、食药、安监等政府机构来参与。今年我们做的是城市管理,很多企业作为数据的提供方来参与,比如摩拜提供了单车数据,仪电和食药监提供了溯源数据,敬众科技提供了航旅数据等。
我们通过比赛进行测试,对于创业者、科研工作者、和大型企业哪些数据是有用的?数据可以怎么使用?这个过程简单来讲,就是数据众筹。数据提供方提供历史的数据片段,将数据片段放到SODA数据池。参赛者可以使用这些数据的小样本构思他们的项目,可以做APP,可以做网站,也可以做可视解读和分析,然后我们选出100个团队进入复赛。在复赛时参赛者需要签署一个授权协议,协议要求数据不允许做二次分发,即参赛者不能泄露数据。
我们让数据到真正需要它的人的手上,使数据产生价值,数据提供单位也可以看到数据到底可以做什么,可以看到数据的价值。
给大家展示几个案例。2015年的参赛团队中有一个叫保橙科技的,他们做UBI,基于用户行为做保险定价。他们使用了强生的数据,强生出租车的数据中有驾驶员行驶轨迹和驾驶速率的数据,保橙科技用这些数据计算出上海市每条道路的平均驾驶速度,并将其作为参考线。购买服务的客户手机上装上APP ,通过手机传感器计算出驾驶员的习惯驾驶速度,和参考线比对后就可以得出驾驶风险的高低。然后他们又将这些风险的指数卖给保险公司,保险公司用它们做智能定价。这就是开放数据带来的商业价值。
第二个案例,通过SODA去启发企业数据的新应用。摩拜单车今年提供了100万条记录,今年大赛有25%的选手做摩拜单车的管控问题,其中一个团队获得了优秀奖。这个团队从摩拜单车刚成为社会热点时就开始对单车问题进行跟踪和数据分析,年初时爬取了摩拜单车APP上的数据看摩拜单车是否都乱停放进入了小区,他们通过数据分析哪些小区存在大量的乱停问题。在今年的SODA大赛中,他们做了一套完整的系统,专门提供给政府和单车企业,用来划定虚拟电子围栏管控共享单车。这个团队甚至都谈不上是一个初创团队,他们只是一群网友,从他们这个团队我们看到,数据一旦流通到对的人手上,会产生意想不到的价值。
而通过SODA也帮助政府去做了数据创新,精细化治理的工作。今年大赛的冠军团队叫做图灵空间,他们就很聪明地将食药监和仪电提供的食品溯源数据、厨余油脂回收数据和工商消费者投诉举报数据以及舆情数据结合,为食药监提供了一套监控食品企业食品安全的面板,而这样的创新本身政府自身是很难完成的。
还有一个来自上海美术大学叫SHU_VIZ_GROUP的团队,他们是做可视化的,今年参赛时推出了一个产品“DataSH”,他们的理念是,虽然上海做数据开放,但干巴巴的数据对大众而言是没有意义的,所以他们将数据转化成可视化内容,帮大众解读数据。基于SODA的开放数据,他们做了一些生动有趣的数据故事,比如上海古树林木的目录清单,告诉大众哪些区县有哪些珍贵的古树,在哪可以找到特殊品种的树木。而这就是SODA本身调动社群去反哺建设开放数据生态的例子。
回到生态体系这个主题上。在这个大赛中,有数据提供方提供数据资源,SODA作为桥梁将数据给到对的数据使用者手上,借由他们去解决这个城市急待解决的问题。这个过程中还有资本方,去助力双方,使创新落地,形成了一个良好的生态圈。
在这个过程中我们也作为观察者,去观测哪些数据对于数据的使用群体非常受欢迎,数据使用者会用这些数据做什么事,将哪些数据进行了组合,数据可以跟哪些应用场景发生关联,这些场景能产生什么样的价值等。而这些洞察反过来可以帮助我们的数据提供单位更好决策如何去流通数据。
大赛同时也促进了双向交互。以交通委提供的刷卡数据为例,会有人问刷卡数据量多大?什么样的业务逻辑产生了这些数据?这些数据有什么质量问题?交通委在采集过程中可能发现不了这些问题,通过大赛就可以发现问题所在,提升数据拥有方产生数据的效能和方式。
无论是大数据还是人工智能一开始就要考虑生态搭建。不同的参与者,数据提供方、使用方、数据服务方、媒体等,大家都处在一个生态体系当中。我们认为更多的数据流通可以帮助问题的供需双方更好地去解读社会问题或者城市问题,在城市问题解读的基础上,我们更有针对性地去做有意义的创新,这样的数据创新反过来引导数据有目的的流通。
我们今年开始做这样一件事情,在大赛的官网上抛出数据提供商和社会问题,引导参赛选手寻找对应的数据解决社会问题。反过来再把参赛者产出的内容抛给数据提供方,整合到一块儿进行呈现,让一些隐藏的信息浮现到台面上,帮助各方做更好的数据流通。
由此我们得出三点启示:
第一,生态思维很重要,只有几方都投入,才能基于数据这样一种基础设施,去把事情做好。
第二,开放重塑过程而非结果,数据流通和开放起来,实际上重塑的是这个过程,带入更多玩家,让他们进入进行PK,他们PK的可能是用户体验、价格或者对数据处理的能力,这些东西对于终端消费者是重大的利好。
第三,考虑每一方的利益,在生态搭建过程中,各方的利益,只有双方或者几方共同利益相通,才有可能谈数据的创新生态。
这就是我今天要分享的内容,谢谢。
推荐阅读:
金电联行征信事业部副总裁范文清:社会信用体系建设要将各种数据进行结合