30个免费数据资源网站

人们都喜欢听故事而不是看数字和公式,数据可视化可能是讲故事的终级神器。但这里有个前提条件,你首先得拥有数据。获取可靠的数据涉及到多个步骤,找到数据、整理清洁数据、转换为合适的格式等等。数据准备往往是数据分析工作中非常让人头疼的方面。随着全世界对数据资源的重视,现在有很多新的公开数据源可供研究者使用。下面就是visual.ly归纳的三十个免费的数据资源网站。本文进行了翻译和补充。



1 政府数据
  • Data.gov:这是美国政府收集的数据资源。声称有多达40万个数据集,包括了原始数据和地理空间格式数据。使用这些数据集需要注意的是:你要进行必要的清理工作,因为许多数据是字符型的或是有缺失值。
  • Socrata它是探索政府相数据的另一个好地方。Socrata的一个了不起的地方是,他们有不错的可视化工具,使研究数据更为容易。
  • 一些城市都有自己的数据门户网站设置,可供访问者浏览城市的相关数据。例如,在旧金山数据网站,你可以获得很多数据,从犯罪统计到城市的停车位。
  • 联合国有关网站,例如世界卫生组织提供了丰富的数据资源,从死亡率到世界饥饿统计数字。
  • 美国人口普查局也有相当多的生活数据,例如收入、种族、教育、人口和商业信息。
2 集成数据
这些网站已经从各种地方收集了相当多的数据。有时更容易从这里找到好东西。
  • Programmable Web:这是一个探索各类API的好地方。
  • infofochimps:提供了一个数据集市,其中有大量的公开数据资源和API资源。类别非常广泛,从Twitter到地理位置数据。用户甚至可以上传自己的数据。
  • Data Market这也是一个好地方,数据包括了经济,医疗保健,食品和农业,汽车行业相关的数据。
  • Google Public data explorer谷歌公共数据浏览容纳大量的数据,从世界发展指标、经合组织和人类发展指标,主要是有关经济数据。
  • Junar这也是一个很好的提供的数据抓取和传送服务的网站。
  • Buzzdata这是一个提供数据共享服务的网站,它允许用户上传自己的数据和连接。
3 社交网络数据
通常情况下要得到社交数据,需要依赖社交网站本身提供的API数据。
  • Twitter:你可以访问Twitter API,但其用途相当有限,Twitter API有一个获取数据的限制。如果需要更多信息,可以去看看Gnip或者PeopleBrowsrDataSift
  • Foursquare:他们有自己的API,你也可以通过Infochimps得到它。
  • Facebook:Facebook的图形API是Facebook的最佳资源。
  • Face.com一个提供面部识别数据的工具。
4 气象数据
  • Wunderground这里提供了详细的天气信息,可以用邮政编码或城市名称来搜索历史数据。它提供了温度、风速、降水等信息。
  • Weatherbase有详细的天气统计数据,近27000个城市的温度,降雨和湿度。
5 体育数据
下面三个网站都提供球队、球员、教练和经理的全面信息。
  • 足球
  • 棒球
  • 篮球
  • ESPN最近也推出了自己的API,但你必须是一个合作伙伴才可以获得他们的数据。
6 高校和科研
针对在某一领域的学者工作进行搜索是获取数据的有效方法。如果你想在一份研究报告中用一份相关数据,最好的办法是直接联系有关专业的大学教授。
加州大学洛杉矶分校提供了一些在其课程中使用的数据集。

7 新闻资料
  • The New York Times:它有一个很好的API和资源管理器访问任何出版物中的文章。
  • The Guardian Data Blog:卫报的数据博客会定期提供一些数据可视化的文章,其数据可通过Google文档格式下载。
下面是笔者的补充:

Apace实时历史数据库ApaceRDB是长沙软动信息科技有限公司自主研发的一套基于分布式事务型的通用实时数据库系统,它可以应用于现代工业企业,包括电力、石油、矿山、化工、钢铁、电信、航空等领域,为这些行业的SIS监控系统、仿真系统等提供数据保障。 Apace实时历史数据库Apace提供对实时时序数据的压缩、计算、存储、告警、分发、查询、统计功能,同时,为上层业务系统开发提供了丰富的应用接口,包括组态设计器以及Excel扩展报表插件。 Apace实时历史数据库系统引入了多种创新的技术和理念,各方面的指标在同类软件中都名列前茅。在实时数据采集方面,Apace可以在一台普通服务器上稳定的承载百万点的数据同步更新;在历史数据处理方面,在对多种压缩算法进行研究改进后,创造了Apace独有的魔方无损压缩算法,1万点1年的历史数据仅需5.8GB的空间。同时,Apace独创的索引技术,可以实现检索的时间无关性,即可以从几十、上百年的历史数据中高效的检索任一时间点的数据;在告警服务里,Apace首度提出了趋势拟合和波动拟合告警,这项技术让Apace的告警能力得到了质的飞跃,可实现更为复杂的告警规则;在计算服务方面,计算规则可以采用C#、VB.NET或JScript语言进行编写,支持程序集动态引用技术,算法设计者可以使用自定义的第三方程序集(如VC动态链接库),强化了计算服务的计算能力。 Apace实时历史数据库Apace组态图设计器,可以轻松的设计出仿真式组态图、趋势图、报表等各种所需的组态图,Apace已经为用户提供了20多种基础元件,除了这些基础元件以外,用户还可以根据行业的需要来自定义新的元件;组态图支持客户端脚本编码,可对图中各个元件进行编码控制。在设计过程中,可以随时对组态图进行预览,以查看实际效果,设计完成后通过内置的发布功能,可随时发布到指定的服务器上以供使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值