SODA理事会理事、苏打数据CEO高丰:只有数据流通,数据才能创造价值

12月1日下午,由上海大数据联盟、数据猿主办的第20期魔方大数据在上海宝华万豪酒店成功举办。本期魔方大数据以“政务大数据”为主题,邀请了技术方和产业方大咖共聚一堂,共同探讨了政务大数据落地实施的有效路径。本文是数据猿整理“SODA理事会理事、苏打数据CEO高丰”的发言实录


作者| 高丰

官网 | www.datayuan.cn

微信公众号ID | datayuancn


12月1日下午,由上海大数据联盟、数据猿主办的第20期魔方大数据在上海宝华万豪酒店成功举办。本期魔方大数据以“政务大数据”为主题,邀请了技术方和产业方大咖共聚一堂,共同探讨了政务大数据落地实施的有效路径。


以下是数据猿整理“SODA理事会理事、苏打数据CEO高丰”的发言实录:



在进入正题前,我想说一下大数据发展的背景。我们经常会说大数据是石油,是一种资源。后来我们也说大数据是一种资产、是孕育价值的土壤。英国开放数据研究院则说数据像公路,是社会的一种基础设施,具有公共属性,以公共属性来服务于不同形态的创新和发展。所以我们考虑SODA这个项目、考虑开放数据,更多是从数据是一种公共基础设施这个角度出发,以此探讨数据做好服务,帮助不同的企业和机构创新。


这个光谱是英国开放数据院做的,从左端到右端是数据流通的不同形态。最左端是数据完全封闭的状态,如国家安全秘密或者个人隐私数据。光谱最右端是完全开放,如面向所有人公开的开放数据。在开放和封闭之间叫共享,用一个比较宽泛的词是流通。开放数据更多情况还是基于公开的数据,加上一个开放协议。开放协议区分了开放数据和流通数据,它允许别人自由使用和分享数据。开放协议是一个权利保障,是开放数据的核心的所在。


公开解决的是信息访问问题,开放解决的是使用问题,退一步看,流通解决的也是使用问题,把数据从不能够使用的资源变成可以使用的资源。


在数据开放和流通方面不仅上海甚至中国乃至全球都存在两个共性问题:


第一,缺乏动力。掌握数据的政府部门或者相关公共企业,为什么要开放数据?开放数据有什么好处?


第二,应用匮乏。动力和应用是一个因果关系,因为政府等部门不知道开放什么数据,所以即使开放了数据也不能满足市场需要,创造不了价值。


2015年我们开始做SODA,音译过来是苏打,苏打有一个深刻的寓意,打开苏打水的瓶盖后,“砰”一下会冒出许多气泡,这就像数据一样,一旦流通起来,会看到 “砰”一下这样的效果。这样的效果可以通过众创众包的形式实现,所以我们做了这样一个尝试,2015年我们和上海交通委做了交通选题大赛,把上海交通一卡通三个月的数据,强生出租车的数据,浦东公交车的数据提供给参赛者。


2016年我们做了城市安全大赛,带动了公安、食药、安监等政府机构来参与。今年我们做的是城市管理,很多企业作为数据的提供方来参与,比如摩拜提供了单车数据,仪电和食药监提供了溯源数据,敬众科技提供了航旅数据等。


我们通过比赛进行测试,对于创业者、科研工作者、和大型企业哪些数据是有用的?数据可以怎么使用?这个过程简单来讲,就是数据众筹。数据提供方提供历史的数据片段,将数据片段放到SODA数据池。参赛者可以使用这些数据的小样本构思他们的项目,可以做APP,可以做网站,也可以做可视解读和分析,然后我们选出100个团队进入复赛。在复赛时参赛者需要签署一个授权协议,协议要求数据不允许做二次分发,即参赛者不能泄露数据。


我们让数据到真正需要它的人的手上,使数据产生价值,数据提供单位也可以看到数据到底可以做什么,可以看到数据的价值。


给大家展示几个案例。2015年的参赛团队中有一个叫保橙科技的,他们做UBI,基于用户行为做保险定价。他们使用了强生的数据,强生出租车的数据中有驾驶员行驶轨迹和驾驶速率的数据,保橙科技用这些数据计算出上海市每条道路的平均驾驶速度,并将其作为参考线。购买服务的客户手机上装上APP ,通过手机传感器计算出驾驶员的习惯驾驶速度,和参考线比对后就可以得出驾驶风险的高低。然后他们又将这些风险的指数卖给保险公司,保险公司用它们做智能定价。这就是开放数据带来的商业价值。


第二个案例,通过SODA去启发企业数据的新应用。摩拜单车今年提供了100万条记录,今年大赛有25%的选手做摩拜单车的管控问题,其中一个团队获得了优秀奖。这个团队从摩拜单车刚成为社会热点时就开始对单车问题进行跟踪和数据分析,年初时爬取了摩拜单车APP上的数据看摩拜单车是否都乱停放进入了小区,他们通过数据分析哪些小区存在大量的乱停问题。在今年的SODA大赛中,他们做了一套完整的系统,专门提供给政府和单车企业,用来划定虚拟电子围栏管控共享单车。这个团队甚至都谈不上是一个初创团队,他们只是一群网友,从他们这个团队我们看到,数据一旦流通到对的人手上,会产生意想不到的价值。


而通过SODA也帮助政府去做了数据创新,精细化治理的工作。今年大赛的冠军团队叫做图灵空间,他们就很聪明地将食药监和仪电提供的食品溯源数据、厨余油脂回收数据和工商消费者投诉举报数据以及舆情数据结合,为食药监提供了一套监控食品企业食品安全的面板,而这样的创新本身政府自身是很难完成的。


还有一个来自上海美术大学叫SHU_VIZ_GROUP的团队,他们是做可视化的,今年参赛时推出了一个产品“DataSH”,他们的理念是,虽然上海做数据开放,但干巴巴的数据对大众而言是没有意义的,所以他们将数据转化成可视化内容,帮大众解读数据。基于SODA的开放数据,他们做了一些生动有趣的数据故事,比如上海古树林木的目录清单,告诉大众哪些区县有哪些珍贵的古树,在哪可以找到特殊品种的树木。而这就是SODA本身调动社群去反哺建设开放数据生态的例子。


回到生态体系这个主题上。在这个大赛中,有数据提供方提供数据资源,SODA作为桥梁将数据给到对的数据使用者手上,借由他们去解决这个城市急待解决的问题。这个过程中还有资本方,去助力双方,使创新落地,形成了一个良好的生态圈。


在这个过程中我们也作为观察者,去观测哪些数据对于数据的使用群体非常受欢迎,数据使用者会用这些数据做什么事,将哪些数据进行了组合,数据可以跟哪些应用场景发生关联,这些场景能产生什么样的价值等。而这些洞察反过来可以帮助我们的数据提供单位更好决策如何去流通数据。   


大赛同时也促进了双向交互。以交通委提供的刷卡数据为例,会有人问刷卡数据量多大?什么样的业务逻辑产生了这些数据?这些数据有什么质量问题?交通委在采集过程中可能发现不了这些问题,通过大赛就可以发现问题所在,提升数据拥有方产生数据的效能和方式。


无论是大数据还是人工智能一开始就要考虑生态搭建。不同的参与者,数据提供方、使用方、数据服务方、媒体等,大家都处在一个生态体系当中。我们认为更多的数据流通可以帮助问题的供需双方更好地去解读社会问题或者城市问题,在城市问题解读的基础上,我们更有针对性地去做有意义的创新,这样的数据创新反过来引导数据有目的的流通。


我们今年开始做这样一件事情,在大赛的官网上抛出数据提供商和社会问题,引导参赛选手寻找对应的数据解决社会问题。反过来再把参赛者产出的内容抛给数据提供方,整合到一块儿进行呈现,让一些隐藏的信息浮现到台面上,帮助各方做更好的数据流通。


由此我们得出三点启示:


第一,生态思维很重要,只有几方都投入,才能基于数据这样一种基础设施,去把事情做好。


第二,开放重塑过程而非结果,数据流通和开放起来,实际上重塑的是这个过程,带入更多玩家,让他们进入进行PK,他们PK的可能是用户体验、价格或者对数据处理的能力,这些东西对于终端消费者是重大的利好。


第三,考虑每一方的利益,在生态搭建过程中,各方的利益,只有双方或者几方共同利益相通,才有可能谈数据的创新生态。


这就是我今天要分享的内容,谢谢。


推荐阅读:


蓝灯数据董事长周强:“大数据”结合“小数据”才能有效破案


金电联行征信事业部副总裁范文清:社会信用体系建设要将各种数据进行结合


梦创双杨大数据负责人杜国宁:产融大数据助力“双创”快速发展


市民云总经理王兆进:手机APP中的智慧城市


机遇与挑战并存 看政务大数据如何提升民生服务水平


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据来源:中经数据库 主要指标110多个(全部都是纯粹的 市辖区 指标),大致是: GDP GDP增速 第一产业增加值占GDP比重 第二产业增加值占GDP比重 第三产业增加值占GDP比重 人均GDP 社会消费品零售总额 固定资产投资(不含农户) 新设外商投资企业数_外商直接投资 实际利用外资金额(美元) 一般公共预算收入 一般公共预算支出 一般公共预算支出_教育 一般公共预算支出_科学技术 金融机构人民币各项存款余额_个人储蓄存款 金融机构人民币各项存款余额 金融机构人民币各项贷款余额 规模以上工业企业单位数 规模以上工业企业单位数_内资企业 规模以上工业企业单位数_港澳台商投资企业 规模以上工业企业单位数_外商投资企业 规模以上工业总产值 规模以上工业总产值_内资企业 规模以上工业总产值_港澳台商投资企业 规模以上工业总产值_外商投资企业 规模以上工业企业流动资产合计 规模以上工业企业固定资产合计 规模以上工业企业利润总额 规模以上工业企业应交增值税 规模以上工业企业主营业务税金及附加 户籍人口数 年均户籍人口数 户籍人口自然增长率 第一产业就业人员占全部城镇单位就业人员比重 第二产业就业人员占全部城镇单位就业人员比重 第三产业就业人员占全部城镇单位就业人员比重 城镇非私营单位就业人员数 城镇非私营单位就业人员数_第一产业 城镇非私营单位就业人员数_第二产业 城镇非私营单位就业人员数_第三产业 城镇非私营单位就业人员数_农、林、牧、渔业 城镇非私营单位就业人员数_采矿业 城镇非私营单位就业人员数_制造业 城镇非私营单位就业人员数_电力、热力、燃气及水生产和供应业 城镇非私营单位就业人员数_建筑业 城镇非私营单位就业人员数_批发和零售业 城镇非私营单位就业人员数_交通运输、仓储和邮政业 城镇非私营单位就业人员数_住宿和餐饮业 城镇非私营单位就业人员数_信息传输、软件和信息技术服务业 城镇非私营单位就业人员数_金融业 城镇非私营单位就业人员数_房地产业 城镇非私营单位就业人员数_租赁和商务服务业 城镇非私营单位就业人员数_科学研究和技术服务业 城镇非私营单位就业人员数_水利、环境和公共设施管理业 城镇非私营单位就业人员数_居民服务、修理和其他服务业 城镇非私营单位就业人员数_教育 城镇非私营单位就业人员数_卫生和社会工作 城镇非私营单位就业人员数_文化、体育和娱乐业 城镇非私营单位就业人员数_公共管理、社会保障和社会组织 城镇非私营单位在岗职工平均人数 城镇就业人员数_私营企业和个体 城镇非私营单位在岗职工工资总额 城镇非私营单位在岗职工平均工资 城镇登记失业人员数 建成区面积 建设用地面积 建设用地面积_居住用地 液化石油气供气总量 液化石油气供气总量_居民家庭 人工煤气、天然气供气总量 人工煤气、天然气供气总量_居民家庭 液化石油气用气人口 人工煤气、天然气用气人口 城市公共汽电车运营车辆数 城市出租汽车运营车辆数 城市公共汽电车客运总量 道路面积 排水管道长度 建成区绿化覆盖面积 建成区绿化覆盖率 绿地面积 公园绿地面积 维护建设资金支出 土地面积 生活用水供水量 供水总量 全社会用电量 城乡居民生活用电量 工业生产用电量 房地产开发投资 房地产开发投资_住宅 限额以上批发和零售业法人单位数 限额以上批发和零售业商品销售总额 普通中学学校数 中等职业教育学校数 普通小学学校数 普通高等学校专任教师数 普通中学专任教师数 中等职业教育专任教师数 普通小学专任教师数 普通高等学校在校生数 普通中学在校生数 中等职业教育在校生数 普通小学在校生数 电视节目综合人口覆盖率 公共图书馆总藏量_图书 医疗卫生机构数_医院和卫生院 卫生人员数_执业(助理)医师 医疗卫生机构床位数_医院和卫生院 城镇职工基本养老保险参保人数 职工基本医疗保险参保人数 失业保险参保人数

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值