大数据博客,资源汇总

博客

HDFS、Mapreduce、HBase、Hive、HUE、Pig、Sqoop、Flume、Zookeeper

网站

Hadoop

HDFS+MapReduce+Yarn 。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算条件。
HDFS的shell操作(常用命令和参数)
HDFS的Java应用开发(数据采集、存储、文件)
MapReduce编程(规范、运行、调试)
MapReduce计算程序(排序、分区、优化)

围绕Hadoop数据库开发的一系列重要工具,比如HBase、Hive、Flume等,主要是训练数据的清洗、处理、分析的技能。
HBase数据操作(读、写、更新)、基本架构
Hive数据存储与计算(表搭建、分区、查询、函数)
Flume&Sqoop采集、导出系统实现
Pig进行数据处理与数据分析

Spark

HBase

JavaAPI操作

Hive

查询、函数、视图

Storm

其他

Sqoop&Flume(数据采集),Pig、HUE、HA。
HUE可视化管理(与HBase、Hive集成)
HA集群:Zookeeper搭建高可用的集群环境

Community

数据挖掘

公开数据集

CRAWDAD
UCI Machine Learning Repository
Stanford Large Network Dataset Collection
SIGKDD - KDD Cup (这个是目前数据挖掘领域最有影响力、最高水平的国际顶级赛事)
NYC Open Data
Lending Club Statistics | LendingClub
Citi Bike System Data | Citi Bike NYC
Stack Exchange Data Explorer
阿里天池大赛
Kaggle有数据,有比赛,还有奖金

路线

初级

星环科技致力于打造企业级大数据基础软件,围绕数据全生命周期为企业提供基础软件及支持,构建明日数据世界。

中级

高级

资料

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值