大数据
「已注销」
这个作者很懒,什么都没留下…
展开
-
Hadoop常用命令
启动Hadoop 进入HADOOP_HOME目录。执行sh bin/start-all.sh 关闭Hadoop 进入HADOOP_HOME目录。执行sh bin/stop-all.sh 1. 查看指定目录下内容 hadoop dfs –ls [文件目录] eg: hadoop dfs –ls /user/wangkai.pt 2. 打开某个已存在文件 hadoop dfs –cat [file_p...原创 2019-07-28 20:59:55 · 225 阅读 · 0 评论 -
Spark性能优化指南
1. 前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。在美团•大众点评,已经有很多同学在各种项目中尝试使用Spark。大多数同学(包括笔者在内),最初开始尝试使用Spark的原因很简单,主要就是为了让大数据计算作业的执行...转载 2019-09-11 17:41:24 · 145 阅读 · 0 评论