【数据采集】数据获取的方式有哪些?

获取数据的方式有很多,如公开的数据集、爬虫、数据采集工具、付费API等。下面解药介绍几个常用的数据网站和获取数据的几种方式。

1、公开的数据集

UCI

经典的机器学习、数据挖掘数据集,包含分类、聚类、回归问题下的多个数据集。

国家数据

国家统计局,包含了我国经济民生等多方面的数据。

CEIC

最完整的一套超过128个国家的经济数据,能精确查找GDP、CPI、进口、出口、外资直接投资、零售、销售以及国际利率等深度数据。

万得

在金融业有着全面的数据覆盖。数据类目更新很快。

搜数网

中国咨询行自1992年以来收集的所有统计和调查数据。

中国统计信息网

国家统计局官网网站,汇集了海量的全国各省级政府各年度的国民经济和社会发展的统计信息等。

亚马逊

来自亚马逊跨学科的云数据平台,包含化学、生物、经济等多个领域的数据集。

Figshare

研究成果的共享平台,可以找到世界各地牛人们的研究成果数据。

Github

包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都较全面,适合做研究和数据分析的人员。

政府开放数据

(1)北京市政府数据资讯网:包含竞技、交通、医疗、天气等数据;
(2)深圳市政府数据开放平台:包含交通、文娱、就业、基础设施等数据;
(3)上海市政务数据服务网:覆盖经济建设、文化科技、信用服务、交通出行等领域数据;

数据竞赛网站

DataCastle:专业的数据科学竞赛平台;
Kaggle:全球最大的数据竞赛平台;
天池:阿里旗下的数据科学竞赛平台;
DataFountain:中国计算机学会(CCF)指定大数据竞赛平台;

2.利用爬虫获取数据

通过爬虫技术爬取网站上的数据。

3.数据交易平台

属于付费平台,如优易数据、数据堂等

4.网络指数

通过指数的变化可以查看某个主题在各个时间段受关注的情况,进行趋势分析、行情分析和预测。如百度指数、阿里指数、友盟指数、爱奇艺指数等。

5.网络采集器

通过软件的形式实现简单快捷的采集网络上分散的内容,如造数、爬山虎等。

  • 9
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

高级数据分析师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值