数据中台架构 开放api_开放数据门户网站应该是API [第一个]

数据中台架构 开放api

什么是API [第一]?

不久前,我在全国政府网络专业人员协会上发言。 在同一个会议上,马克·黑德(Mark Headd)发言。 我们在谈论不同的开放数据主题。 我的讨论是关于开放政府与开放数据之间的区别,而他的演讲是关于API [First]。

幸运的是,他们在不同的时间安排了我们的行程,因此我有机会看到他就使用开放数据的网站开发API [First]策略发表演讲。 他的副标题是“将开放数据作为更好网站的基础”。

API [First]本质上是与设备无关的设计。 Mark提出的前提是,网站在部署后通常会改版API(应用程序接口)。 API可能会也可能不会响应从网站上寻求数据的用户的抓取。 我喜欢这个演讲,并且理解为什么在考虑网站之前先考虑API是有意义的。

本文讨论了将来可能会发生什么。 今天的开放数据仍沿袭20年前Gartner的“ Hype-Cycle”。 我们将看到机器比人类更多地消耗数据。 这是关于根据轶事和调查证据如何使用数据的假设。 没有更多的数据,我无法证明任何结论性的事情,但是我可以假设以下内容:

  • 人类消耗的数据具有较低的重用价值,因为它不会被重新分发
  • 通过Web /移动平台[First]提供的数据比使用API​​ [First]的平台需要更多的工作来重用数据。
  • 来自媒体,技术和学术界的高级用户绝大多数时间都在浏览Open Raleigh数据门户上
  • 数据门户网站元素固有的UX问题使它们难以使用

数据门户不仅仅是任何网站

我想进一步介绍一下。 在线数据应该是API [First],并且数据门户需要替换为更有用和更不烦人的东西。 11月,我完成了关于Open Raleigh的调查,并收到了100多个公众的反馈。 公众对更新的类型,更新频率和数据质量表现出良好的反响,但他们确实不喜欢该界面。 大多数界面评论都与延迟有关,有时还显示不兼容。

我完全同意他们的结论。 数据和经过改进的API很棒,但是它们被锁在几乎无法使用的笼子里。 如果平台是基于API而非Web [First]策略构建的,该怎么办? 我们可能会发现,开发人员可以修改数据及其附带的探索小工具,以适应当前和将来的设备,而在罗利市方面的工作量较少。

Figure 1: October 2014 Rows Loaded

图1:2014年10月行已加载

如果我们看一下数据站点的实际使用方式,而不是市场营销方式,我们开始看到一些模式的出现。 在过去的18个月中,Open Raleigh的人工页面浏览量为1,115,125,其中大部分在最近的六个月中。 2014年10月,我们达到了17,000,000个API调用的峰值。 在一个月内,我们的观看机数量是人类的17倍。

从图中可以看出,9月和11月距离10月不远。 一些读者可能想知道为什么从2014年5月开始API调用会激增。从5月到10月,人们花了很多时间在Red Hat JBOSS Switch Yard上构建开源服务体系结构,该体系结构可以挖掘并自动在Open Raleigh Portal中添加数据集。

Open Raleigh使用对大多数手持设备都友好的响应式Web设计,但是API需要一些帮助才能将数据推送到门户中。 门户网站本身会将每个数据集都发布为API端点。 该API是只读 API。 编写一些代码,我们可以使Socrata门户允许我们追加数据集。 在Web / Mobile [First]类别中,Socrata并不孤单。 ESRICKANJunar在某种程度上都是基于相同的原则构建的。 这不是对任何特定平台的直接批评或认可。

弄错了的后果

讨论多节点方法并拥护API [First]策略似乎很深奥,直到人们通过一些最近的门户发布来探讨轶事问题为止。 明尼阿波利斯(Minneapolis)最近启动了它的开放数据门户, 严厉审查 。 大多数批评都集中在网站的性能,延迟,无响应设计和崩溃的网页上。 请注意,这些都是公民试图通过不同的浏览器使用门户网站的投诉。 该市将责任归咎于ESRI,但延迟和未验证页面设计不佳并非平台固有。 ESRI不是API [第一]产品。 这个城市说它应该和苏格拉底一起走。 考虑到该城市具有管理部署的能力,似乎很明显,缺乏基于多节点标准的方法是导致Beta测试失败的重要原因,但不是单一原因。

CKAN最近还通过一条推文宣布启动一个有关埃博拉危机的新的,全面的开放数据门户。 这不是响应式设计。 在移动设备上查看时,我会看到整个站点的一个很小的版本,除非切换到更大的界面,否则无法有意义地使用或重复使用数据。 现在让我们考虑一下这样做的后果:

  • 谁提供数据? 如果是针对现场工作人员,这将是一个巨大的失败。 最常见的现场设备是平板电脑和移动设备。 没有某种使用API​​的应用程序将成为数据重用的障碍。
  • 如何使用和重复使用数据? 跟随链接的“兔子洞”,我可以获取有关危机数据的地理数据。 大多数目录列表都是CSV数据集,而PDF则提供了数据的上下文。 这样做的好处是我拥有元数据,而缺点是我无法查询一个明显的API点以将该站点的数据与其他数据合并以进行自己的分析。

结论

这只是冰山一角。 除了围绕不使用API​​ [First]策略的技术问题之外,我们还存在围绕PII(在明尼阿波利斯)的政策问题和CKAN实例中的UX问题。 因此,我通过比较人类和API消耗的数据得出以下结论:

  • 人类消耗的数据具有较低的重用价值,因为它们不会被重新分发
  • 通过Web /移动平台[First]提供的数据比使用API​​ [First]的平台需要更多的工作来重用数据。

翻译自: https://opensource.com/government/14/12/open-data-portals-api-first

数据中台架构 开放api

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值