关闭

大数据从何而来?你必须知道的7个数据源供应平台

388人阅读 评论(0) 收藏 举报

  我们都知道一句话“巧妇难为无米之炊”,数据源就是数据产生价值中的那些大米。那大数据时代企业需要哪些数据呢?根据我个人理解我觉得可以大致分为以下几类:

  1、(内部)企业自身业务生产经营环节产生的内部数据(包括销售、客服、仓储、财务等)

  2、(运营)可以理解为企业发展过程中掌握在第三方手中的数据,如企业的广告供应商以及一些传播与媒体数据(新媒体、H5、app等)

  3、(外部)包括传统调研数据和机器数据【搜索、电商、社交等】。而对于外部数据的获取上,企业往往会觉得有难度,这时候就可以借助API供应商的力量来补充自己的数据源。

  先来科普个概念,开放应用程序的API(即Application Program Interface,应用程序接口)可以让开发者在无需访问源码,或理解内部工作机制细节的情况下,调用他人共享的功能和资源。对于数据源的获取上API是个好伙伴。本文将介绍7款API供应平台:百度APIStore、Apix、数说聚合、通联数据、HaoService、聚合数据、datasift 。排名不分先后!

  本文作者阿尔法汪

  1. 功能上对比



  注:这2张图是连一起,因为缩小了大家看不清,截成2张图了

  2. 详细介绍

  2.1 百度API Store


  百度旗下的API Store,能够满足大部分个人应用开发者,特别是其最近推出的Android和IOS SDK,更是移动开发者的福音。其接口分类较细,但是感觉有一些分类之间存在交集,没有明显的边界区分。接口、数据更新速度也比较快,且支持个人发布与定制化服务,上千的接口量基本可以满足一般开发者的需求。提供移动开发SDK,方便移动开发者快速、便捷调用API Store服务所开发的SDK包,加上API文档清晰明了,上手真的十分简单。但缺点就是由于接口杂乱繁多且来源不一,部分接口的质量、稳定性没有保证。

  2.2 Apix


  Apix更多是面向小贷机构、互联网金融、租赁保理等行业客户,除了提供身份核验、工商信息、失信名单、支付缴费等接口,还有包括电商、学历信息、运营商记录、信用卡账单等分析服务。从开发到分析为客户提供一条龙服务。其数据分类包括征信风控、支付缴费和常用数据,而征信风投是其主打数据。由于这类数据具有专业性,因此收费相比其他API会稍微偏高。接口大多数是Apix自主开发,质量有保证,部分核查接口的高级版还能联网检测,就是接口的数量确实有点少。

  2.3 聚合数据


  聚合数据跟百度的APIStore有点像,接口包括生活、旅游、金融、开发、咨询等分类,还比较全面,更加适合对接口质量和稳定性有较高要求的公司或企业级应用的开发者。但是并不支持个人发布,因此接口的质量和稳定性会比较好,但也正因为这样接口量大大减少。聚合数据给我的感觉更像是致力于打造高质量API,不求广而求精。不过申请使用接口需要实名认证和审核,算是双刃剑吧,对于买卖双方来说是一个保障,但是对于试用者来说是一个不太好的体验。

  2.4 HaoService


  Haoservice近期更新后推出了源码商城,用户可在上面直接购买商城、管理系统、UDP通讯源、发布系统等源码。总体来说比较适合公司或企业级应用的开发者。其主打生活服务类接口,主推基站、定位、地址解析、坐标服务等API,目前仅支持企业用户发布接口,因此接口的质量和稳定性有保障,但接口数量也是一个痛点。VIP级别以上用户可进行个性化定制,且有专人24小时技术支持,服务到位。

  2.5 通联数据


  通联数据提供行情、沪深股市/期权、债券、基金、咨询、研究报告等API,十分适合金融类应用和金融咨询网站、平台的开发者以及从事金融行业的分析、业务人员。通联数据专注于金融大数据,上千的数据接口可以满足金融行业的大部分需求。数据有API和研报两种格式,接口来源于自主研发或恒生聚源、九次方大数据、华通人、朝阳永续、中诚信资讯、巨灵财经等企业,质量可靠、稳定、安全。金融数据服务体系完善,与公司其他几款产品打通,为用户提供一站式金融服务。

  2.6 数说聚合


  数说聚合跟上面的数据API不同,面向的客户不只是大数据应用开发者,对互联网数据有强烈需求的各行业分析师、业务人员、运营人员同样可以通过数说聚合拿到你们想要的数据。数据覆盖范围十分广泛,包括国内社交、新闻、电商、互联网垂直领域等多平台多维度的数据。用户可以通过接口调用、文件下载等方式获取数据。接口完全自主研发,质量、稳定性十分有保障,且支持个性化定制。不过目前只面向企业用户,个人用户想要使用可能还需要一段时间。

  2.7 Datasift


  Datasift的性质与数说聚合相似,其数据基本覆盖国外主流网站,包括Facebook、Tumblr、Google+、YouTube、Instagram等等,且提供数据分析服务。无论从产品的使用还是服务,都给用户不错的体验。来源于国外站点的数据质量也很好,不过可能是服务器在国外的原因,响应会有明显的延迟;而国内站点数据的话,小编曾经在datasift购买微博数据(当时在国外无法通过国内公司购买微博的数据),数据质量只能说一般。其业务目前暂未向国内市场开放,只能通过特殊途径购买。

  以上是国内外比较知名的数据API产品,基础性的可能更多会选择百度APIStore、聚合数据、Haoservice。而对于行业、专业有特别需求的用户来说,通联数据、Apix会使不错的选择。如果是需求国内社交、电商、资讯平台的数据,可以考虑数说聚合,如果是要国外数据,小编则比较推荐Datasift。读者可根据自身的需求,选择最适合的API。

推荐阅读  http://www.lemonpai.com/1985.html  数据挖掘在精准营销中的应用

1
0
查看评论

你必须知道的.NET(第2版)(奋斗的小鸟)_PDF 电子书

下载地址:http://pan.baidu.com/share/link?shareid=1270688138&uk=721744522
  • tjoy2005
  • tjoy2005
  • 2013-10-09 19:11
  • 2081

你必须知道的.NET(第2版)

王涛 编著 ISBN 978-7-121-14128-7   2011年7月出版 定价:79.00元 16开 548页 宣传语:以深入浅出的笔法,触摸.NET底层和框架的有趣角落,了解.NET平台的开发、设计与框架,剥丝抽茧,探微知著。从语言细节到设计架构,娓娓道来,
  • broadview2006
  • broadview2006
  • 2011-08-09 17:56
  • 4266

你必须知道的.NET

主要讲.NET底层的一些语言机制,载体为C#。写得比较深入,是本好书。LOH堆 (Large Object Heap) ,用于分配大对象实例。LOH堆不会被压缩,而且只在完全GC回收时被回收 并非所有的值类型都创建在线程的堆栈上,当值类型作为类的字段、或作为堆上实例成员的一部分、或发生装箱时,该值...
  • s10141303
  • s10141303
  • 2015-07-03 23:30
  • 1601

数据挖掘 你必须知道的32个经典案例(电子书)

需要完整版电子书的加QQ:404178824
  • Siphiababy
  • Siphiababy
  • 2017-09-12 20:57
  • 596

你必须知道的261个Java语言问题笔记- Java与面向对象

Java与面向对象
  • jitingfang
  • jitingfang
  • 2017-08-07 23:50
  • 203

如果有人问你什么是大数据?不妨说说这10个典型的大数据案例

在听Gartner的分析师Doug Laney用55分钟讲述55个大数据应用案例之前,你可能对于大数据是否落地还心存疑虑。Laney的演讲如同莎士比亚的全集一样,不过可能“缺乏娱乐性而更具信息量”(也许对于技术人员来说是这样的)。这个演讲是对大数据3v特性的全面阐释:variety(类型)、velo...
  • op07p6Aaqo9u71
  • op07p6Aaqo9u71
  • 2017-10-31 00:00
  • 527

日语中7个必须知道的词句

你已经订票日本。 你已掌握了所有的基础知识 ,你认为你能在日本举行的多次交谈 。 有信心满溢你在街上游荡,近乎乞求你的第一个用母语有意义的互动 。 你终于设法克服自己的限制,停止日本的人,并要求为应该是附近的爱好商店...
  • xuexiriyu111
  • xuexiriyu111
  • 2016-05-04 14:47
  • 109

关于数据库你必须知道

数据库是按照数据结构来组织、存储和管理数据的仓库。其发展阶段大致可分为:人工管理阶段、文件系统阶段、数据库系统阶段、高级数据库阶段。现代社会我们更是离不开数据库,数据库每天都在进行大量的数据交互,提高数据库的速度自然成为一个我们不可忽视的问题,在此就跟大家分享几个关于数据库的几个常识,希望对大家在对...
  • baidu_28744047
  • baidu_28744047
  • 2015-06-04 15:28
  • 71

六款大数据采集平台的架构分析

随着大数据越来越被重视,数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台: Apache FlumeFluentdLogstashChukwaScribeSplunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程: 数据...
  • u010299467
  • u010299467
  • 2016-01-25 10:22
  • 4394

大数据处理平台基础架构-sohu-smc

做数据已经1个季度了,这里再说下我们的整体构架,另外说下现在还有哪些问题。   Sohu-smc  数据处理平台基础架构图   如图,左侧是整个大数据处理流程中数据的流向。其中绿色部分是日常工作的重点,黑色部分推荐组做,灰色部分相对固定。   ...
  • liuzeheng
  • liuzeheng
  • 2014-10-22 12:09
  • 1846
    个人资料
    • 访问:19450次
    • 积分:581
    • 等级:
    • 排名:千里之外
    • 原创:39篇
    • 转载:1篇
    • 译文:0篇
    • 评论:2条
    最新评论