前面介绍过实用的效率小工具,真的帮了我很多忙,这次给小伙伴们再种草一些数据源网站。
现在有很多免费的数据可以供使用分析,不过很少有人能找的到,或者没能力找,这就是所谓的信息差吧。其实数据获取分为两方面,一是“拿来的”数据,也就是现成的;二是“爬来的”数据,这种一般通过爬虫等手段去采集数据。
“拿来的”数据可以在各大官方平台或者社区去找,一般各行各业都会有自己的数据库。我常用的数据网站有以下这些:
搜索指数类
百度指数:百度搜索汇总的数据,能看到各种关键词的搜索热度趋势,优点数据量大,能反映真实的话题热度变化,适合做需求洞察、用户画像、舆情监测、市场分析。
百度指数规则,是以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和。
![4dd694f371d78a6b8687fd08e1b3fb5b.png](https://i-blog.csdnimg.cn/blog_migrate/206740f4dd6e07e5ff7fb7a357b3cb78.png)
微信指数:微信生态的大数据,反映关键词热度,和百度指数类似。但微信指数数据来源微信各种内容渠道,包括搜一搜、视频号、公众号等,适合做微信生态人群画像、内容推广、舆情监控的研究。
在计算关键词指数的过程中,微信指数主要关注:
关键词相关内容的受欢迎程度。
关键词在相关内容中的重要程度。
![1e87cd3abef93c23150d076b00f96572.png](https://i-blog.csdnimg.cn/blog_migrate/796529ce833e3858209257741d2ed45a.png)
Google Trends:和百度指数类似的产品,基于google生态汇总的大数据。比百度数据来源更丰富也更广泛,包含了google、youtube等,毕竟是全球应用。缺点是对国内搜索分析的指导意义不大,还是百度指数更具指导意义。
![5375e7360315df0bea772c83078506f6.png](https://i-blog.csdnimg.cn/blog_migrate/f212821eb2540e135a96456c54edd001.png)
微博指数:微博内容提及量、阅读量、互动量加权得出的综合指数,优点比较有时效性,而且数据基数大,可以实时反映热度变化情况,适合实时捕捉当前社会热点事件、热点话题等,快速响应舆论走向等。
![6b2e7106edc76c99b02071c769066c0c.png](https://i-blog.csdnimg.cn/blog_migrate/abbf5c66037048cd5923101b2bbd48e1.png)
媒体数据
这种数据包含了网站、APP、自媒体账号等监测数据,大多是商业付费类
Alexa:用于查询全球网站排名和流量的平台,可以看到PV、UV、排名、区域分布等信息。
![1dbf75570ae9abde6e5e78cd5a1ba191.png](https://i-blog.csdnimg.cn/blog_migrate/1a263a59656227bdba4ac05a6988a715.png)
新榜:新媒体专属的数据平台,用于查看抖音、快手、公众号、小红书等平台KOL账号的数据。数据包括了粉丝、浏览、互动、声量等,一般用于广告投放监测、自媒体数据运营等。
![37975aa10a41a5176dfdcf9987e11b08.png](https://i-blog.csdnimg.cn/blog_migrate/b47db4f6a56e079f518f32b1a34c2de8.png)
猫眼数据:影视相关数据。汇总了电影票房、网播热度、电视收视等数据,适合做票房预测、节目热度监测。
![b7b2c988c5d45facf9a1170c1c75da81.png](https://i-blog.csdnimg.cn/blog_migrate/bbcd51c06847b8bd689ae0e1fe70fb53.png)
艾瑞指数:APP、Web、手机等排行榜数据,包括各大移动设备装机指数、APP热度指数、PC Web热度指数、网络广告指数等等,适合做广告营销投放等。
![aa2b2ad4871691917349de2e68bf1776.png](https://i-blog.csdnimg.cn/blog_migrate/667d7ef9b5220dbf22802f53869bc57f.png)
金融数据
新浪财经数据中心:新浪财经大数据,汇总了股票、基金、期货、黄金、货币等各种财经数据,种类很齐全,应该有数据接口。
![e34f1e234d2ce27fc3cb746365bc884f.png](https://i-blog.csdnimg.cn/blog_migrate/8e6064c167f2a632a03fcf44c1b2cbfb.png)
Wind:国内比较早的金融数据服务商,数据种类最齐全,而且有各种金融分析工具,也支持Python、R等量化分析。但Wind很贵,个人很难承担的起。
![07b7681fc6e70e3db3b5e982c3697a27.png](https://i-blog.csdnimg.cn/blog_migrate/5be521bd6e40c2a5963b857ae5edfefe.png)
Tushare:免费的金融数据库,支持Python接口,数据也非常齐全,包含了股票、基金、期权、债券、外汇、公司报表等各种财经数据。只要你会用Python,就可以调用里面的各种数据,非常便捷。
![c56dbc8c9a73db5475952358aaa565f8.png](https://i-blog.csdnimg.cn/blog_migrate/163967f865d621a04d990ba9d36acd2f.png)
社会数据
这种一般包含政府开放数据、统计数据,以及各种民生数据。
国家统计局:最权威的国内宏观数据网站,包括人口、经济、农业等等。
![4babb6a3f567c7d96829a3ec5e3a004f.png](https://i-blog.csdnimg.cn/blog_migrate/549ee39e612b1238a31b406970a4adee.png)
上海公共数据开放平台:上海市各行各业的免费数据,对公众开放下载,非常适合做城市规划分析。
![541491fe2c990a73a70415cb04f1f7e7.png](https://i-blog.csdnimg.cn/blog_migrate/aa6c94c8b5cb5b1330e20ce88727a429.png)
其他城市官方数据:
![221869d6c9684a8538dfc7d9fc90e9dd.png](https://i-blog.csdnimg.cn/blog_migrate/7f1233a5f7b2241d33ae7d9bfc904d6c.png)
![02028e518f20229e8281beae3ece724c.png](https://i-blog.csdnimg.cn/blog_migrate/337b45ba8bbd0293195d75c74453614a.png)
数据科学研究数据
这一类数据适合做机器学习、统计分析、算法研究等,是学术界、工业界用于数据驱动业务典型数据。
kaggle:全球最大的数据科学比赛平台,也是google旗下的产品。kaggle拥有丰富的数据集和各种解决方案,适合对数据感兴趣的小伙伴去研究学习。
![21c0649ae4de9d1c17bfbe5789774614.png](https://i-blog.csdnimg.cn/blog_migrate/752035d7ff4fbf927c0bacde5f57e138.png)
天池:阿里云里面的数据比赛平台,也拥有很多比赛数据,质量相对较高。
![333ee62d249f4f0361ec453eec039675.png](https://i-blog.csdnimg.cn/blog_migrate/9afb2e4bca25433a23ddb8694e7aa244.png)