Python学习十大公开免费数据集介绍

最新推荐文章于 2024-06-22 10:09:36 发布

egregw

最新推荐文章于 2024-06-22 10:09:36 发布

阅读量928

点赞数 22

分类专栏：程序员文章标签： python 学习开发语言

本文链接：https://blog.csdn.net/egregw/article/details/138303747

版权

190 篇文章 0 订阅

订阅专栏

对于公司和学校内部的数据，一般都是比较机密，但是你想主动去帮助他们处理，问老师或老大要些数据来练习，他们还是很愿意的（毕竟多了一个人肉数据清洗机）。

即帮助了老师们的工作，又学到了技术，一举两得的事情我是最喜欢的

任何数据，只要你在网上能用肉眼看到，理论上都是可以爬取下来的，小到使用爬取个百度图片，大到把一个网站数据库连锅端了完全了没有问题。所以自己做项目分析来练手的数据（除非是得自己生产），都可以用爬虫的方式进行爬取

但是理论归理论，理想很丰满，实际上只能动手复制粘贴

爬虫不如白嫖，网上的数据源特别多，但是也特别分散或者还收费（例如某觉中国），所以行哥这里给大家精选十大数据网站，让你白嫖到装满电脑为止

3.1 Kaggle数据集：https://www.kesci.com/home/dataset 这是一个集竞赛、数据和学习为一体的网站，之前烂大街的泰坦尼克号数据分析就是这个网站提供的数据源头。当然也有各种算法竞赛，拿钱学习两不误

3.2 阿里云天池数据集 https://tianchi.aliyun.com/ 如果英语不好的话，可以使用国内的阿里云天池数据集。这里不仅提供公共数据集，还有免费系统的AI课程可以学，还用你再找那些七零八落的课程资料吗

3.3 股票数据：http://tushare.waditu.com/ 想学量化交易的同学肯定不能错过这个网站，之前行哥交流群里的同学@Jason在问有没有那种运行代码就能赚钱的技术，你看这个量化领域就是（不过技术不精可能最后裤衩都了）

3.4 谷歌开源数据集：https://datasetsearch.research.google.com/ 想找官方数据的话得一个个去统计局找，也可以来这个谷歌开源数据集来。比如中国历年平均工资的分布，平均年工资为90501 元，快看看你有没有拖后腿
3.5 微软数据集：https://msropendata.com/datasets?domain=PHYSICS 微软数据集提供了生物，计算机科学，地球科学，健康护理，数学，物理，社会科学等，想找一些偏僻的数据可以来这里找找
3.6 Github网站：

https://github.com/awesomedata/awesome-public-datasets 整个Github有很多项目大家可以学习，但是上面这个网址整理很多awesome的数据集，一共有32个类别。看完足够你awesome

3.7 计算机视觉数据集：https://www.visualdata.io/discovery 昨天还有小老弟跟行哥唠，说那么多图像怎么一个个标注啊，那不得标成傻子了。这不，今天它来了，直接提供标注好的图像数据，图像识别还不赶紧学起

3.8 卫星数据集：google earth 卫星数据动辄几个G，上百个G。总不能一台电脑全保存上卫星数据，就算保存上了，随便调用运算，家用电脑估计就够呛了。所以这个谷歌地球引擎直接提供平台，可以在这个平台里随意调用上百G卫星数据，并在谷歌提供的服务器里运算，这样上手不就更快了

如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费学习大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

工欲善其必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

成为一个Python程序员专家或许需要花费数年时间，但是打下坚实的基础只要几周就可以，如果你按照我提供的学习路线以及资料有意识地去实践，你就有很大可能成功！
最后祝你好运！！！

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

关注

专栏目录