大数据资源整理

https://zhuanlan.zhihu.com/p/24231891

大数据资源整理

林梓

林梓

假程序媛,真女汉子~

大数据最近几年很火,如果你去问读研的小伙伴,搞计算机的,我相信不是搞数据处理就是搞机器学习的,这都属于大数据的范畴。虽然大数据很火,但是网上的资源却比较少,主要是很零碎,不成体系。

当然,想要搞大数据,数学知识诸如:高等数学,线性代数,概率论,统计学……是必不可少的,我这里就不介绍这些相关资源了;当然也不整理算法啦、数据结构啦、具体的语言学习啦这些基础知识;那肯定更不会整理大数据相关的具体业务应用或者处理啦,毕竟这个是需要经验的。

我主要是想整理一些相对而言比较成体系的大数据教程,其次会分享一些相关的网站、文章和资源,希望对想学习大数据的小伙伴有所帮助~

一、大数据学习路线及脑图:

我比较认同在开始学习前摸清大概的方向,清楚自己想要往哪个方向发展,知道基本的背景知识以及基础知识,这样学习起来才不会迷茫,才有方向感。

一般比较常见的数据技术岗位有:算法挖掘、数据仓库、架构师、ETL研发和分析技术等相关的岗位,强烈建议想往大数据方向发展的小伙伴多去各大招聘网站看看关于大数据相关岗位的招聘要求,非常有助于了解到底应该学什么。

下面分享的前三张图片是大数据脑图,后面是一些关于大数据学习路线的文章。希望你看完这些后对于方向有个大概的把握,而不只是笼统的想要搞大数据。

1)大数据脑图:

2)大数据工程师 - 学习路径 - 实验楼


3)png-BigData-by-StuQ

上面三张图片应该可以清楚的了解到大数据相关技术包含哪些,就是说想要搞大数据就离不开上面所说的各种技术,你就需要掌握上面的技能,当然具体该掌握哪些技能,就看自己的发展方向了。

下面是一些文章以及问答,也推荐看看:

  • 问答网站Quora上精华帖

 

1) How-can-I-become-a-data-scientist

 

2) What-are-some-good-resources-for-learning-about-statistical-analysis

3) What are some good free resources to learn data science?

 

二、学习网站:

上面是基础知识、背景知识的了解,了解之后就需要学习啦,这里介绍几个可以学习大数据的网站。

 

coursera 上有个数据科学分类,进入就可以看到数据分析、机器学习,每个小分类里面有多门课程,可以选择自己感兴趣的进行学习,是比较系统的课程。

 

实验楼上关于大数据的教程,主要是hadoop、spark、Python的教程比较多,算是比较系统,R语言的教程也有,更有实践项目可以学习,重要的是拥有在线开发环境,这对于大数据的学习非常方便。

 

慕课网上关于大数据的教程呢,比较零碎,但是还是可以找到想了解的技术教程。

 

云课堂上的教程质量参差不齐,开课者也是五花八门,上面关于大数据方面的教程呢,想学习是需要好好挑选一番的。

 

CSDN的这个大数据知识库呢,可以找到一些资源,不过也是比较零碎,资源的好坏需要自己筛选一番。

当然书籍也是需要看的,毕竟书籍系统、全面,嗯~我这里就不整理推荐的书籍资源了,该看什么书籍、想看什么书籍,我想每个人的需求都不同。

三、其他一些网站:

上面介绍的是学习网站,基本都是中文,下面分享一些其他关于大数据的网站,也能找到相应的资讯和教程。

 

当然,除了上面推荐的网站,在其他一些你比较常逛的网站里,我相信也能找到大数据相关的文章或者资讯,自己有留意就好。

四、一些资源集合:

下面整理一些大数据相关的资源合集,里面都可以找到不错的资源。

五、关于大数据应用比较有趣的网站:

其实关于大数据的应用有很多,其中基于大数据方面的数据可视化比较有趣,因此这里分享几个有趣的大数据应用网站。

kaspersky.com

网站由防毒软件提供,卡巴斯基制作的 Cybermap ,这个作品能实时展现现在世界上有多少起服务器攻击事件。点进去之后,可以看到地球上纵横交错地飞舞着蓝色、绿色、红色线条,这些就是表示服务器攻击事件。

 

apple每秒实时数据

 

可以实时的展示出Apple的相关数据,比如卖了多少产品啊,有多少APP被下载啊……,比较有趣;

 

internet-map

 

全世界各大网站的可视化,网站都用圆形表示,圆的大小表示网站的访问量。中国是黄色,美国是蓝色,日本是紫色,欧洲是红色。可以搜索相应的国家看到详细的情况,看到那个黄色的最大的圆圈没?那就是中国访问量最高的网站,百度。

 

百度高考预测

 

百度预测里面的高考预测也是一个蛮有趣的大数据应用,可以看到每个学校的报考难易程度。

啊,一下子太多了,整理的头都痛了,先暂时这样,以后慢慢添加进来~

以上就是我整理的关于大数据学习相关的资源,相信对于初学者还是有一定的帮助,如果你有其他的相关资源,欢迎评论给我,我添加进来啊~

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
推荐,最强大数据学习与最佳实践资料合集,基础+架构+治理+案例,共100份。 一、基础篇 快手EB级HDFS挑战与实践 Hive任务开发规范 一文看懂Hadoop生态圈 资料-CentOS7搭建Hadoop-2.7.7集群 ClickHouse官方中文文档 ETL流程、数据流图及ETL过程解决方案 Google-MapReduce中文版_1.0 Hadoop安装及分布式部署 Hadoop精选面试题和MapReduce编程企业级编程实践 HDFS-part2-原理详解 HDFS核心内容及命令-2020 hive安装 hive语法和常用函数 Kafka安装 kylin安装 mapreduce调优指南 sqoop安装 二、架构篇 Flink-1.11 Hive集成与批流一体 ClickHouse在苏宁用户画像场景的实践 优酷大数据 OLAP 技术选型 阿里数据湖选型 各种系统架构图与详细说明 关于BI工具选型的参考依据 Apache Doris在京东搜索实时OLAP中的应用 ClickHouse官方中文文档 ClickHouse原理解析与应用实践 Doris竞品对比 Doris在美团外卖数仓架构中业务实践与改进思路 DorisDB原理剖析 和应用实践篇2021 Flink 流批一体的技术架构以及在阿里的实践 Flink实时仓库实践 Hadoop开源相关,Flink,Kylin等集群搭建2021 KylinCloud+Hudi实践 三、数仓篇 传统数仓与大数据数仓区别 模板-事实表梳理 模板-维度梳理 模板-业务梳理 模板-指标体系梳理 模板1-数据仓库项目计划 模板2-命名规范 模板3_访谈提问和沟通记录单模板 模板4_公共数据资源管理调研模板 模板5_公共数据资源管理分析模板 模板6-报表需求梳理 内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库 商业银行数据仓库系统V2.0 数据仓库建设方案 数据仓库建设规范模板 数据仓库整体设计方案模板 Hadoop构建数据仓库实践 四、治理篇 快手从模型规范开始的数据治理实践 第12章元数据管理-DAMA-DMBOK:数据管理知识体系 权限管理设计方案 数据安全模板-访问权限梳理表 数据治理服务解决方案 数据治理及数据资产化创新实践-京东 万振龙:数据治理与大数据平台设计 主数据管理实践白皮书(1.0版) Apache atlas使用说明文档 atlas安装 CDH启用kerberos身份认证和sentry权限管理 DAMA-部委级数据治理项目经验分享 GrowingIO 2020指标体系与数据采集 GrowingIO公开课:搭建业务+数据一体化的指标体系 IBM 数据治理统一流程 ISO38500 IT治理国际标准 ISO_IEC_38500_2008_version_PDF 五、案例篇 字节Apache Flink在字节跳动的实践 Hudi on Flink在顺丰的实践应用-蔡适择 滴滴Flink在滴滴出行的应用与实践 阿里基于Flink的实时计算平台 菜鸟在物流场景中基于Apache Flink的流计算实践 腾讯clickhouse实践 Clickhouse玩转每天千亿数据-趣头条 微博基于Flink的机器学习实践 快手稳定性体系建设 快手元数据平台化建设及应用场景 快手指标规范化及OneService平台化实战 Apache Flink 在美团的实践与应用 快手服务治理平台+KESS+的设计理念和实战 快手数据中台建设:大数据服务化之路 快手离线数据全链路分级保障平台化建设 快手万亿级实时 OLAP 平台的建设与实践 ClickHouse在快手的大规模应用与架构改进 美团点评酒旅数据仓库建设实践 美团酒旅数据治理实践 美团外卖为何使用Doris创建数据仓库 内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库 实时数据产品实践——美团大交通战场沙盘 ClickHouse在苏宁用户画像场景的实践 腾讯云clickhouse性能调优实践 融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系 ClickHouse 在头条的技术演进 Doris的用户画像人群应用-会议组 Doris在美团外卖数仓架构中业务实践与改进思路 Flink 在 OPPO 的平台研发与应用实践 Flink实时仓库实践 Flink在滴滴的应用实践

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值