- 博客(6)
- 收藏
- 关注
原创 Apache Hadoop 3.0.0 GA版正式发布,可以部署到线上
今天凌晨 Apache Hadoop 3.0.0 GA 版本正式发布,这意味着我们就可以正式在线上使用 Hadoop 3.0.0 了!这个版本是 Apache Hadoop 3.0.0 的第一个稳定版本,有很多重大的改进,比如支持 EC、支持多于2个的NameNodes、Intra-datanode均衡器等等。下面是关于 Apache Hadoop 3.0.0 GA 的正式介绍。如果想及时了解Sp
2017-12-15 00:00:00 1400
原创 如何在 Hadoop 2.2.0 环境下使用 Spark 2.2.x
如果下面文章格式或图片不清晰,请参见原文:https://www.iteblog.com/archives/2305.html 或直接点击下面 阅读原文 即可进入。到 Github 下载支持 Hadoop 2.5 及其之前版本的 Spark 2.2.1 :https://github.com/397090770/spark-2.2-for-hadoop-2.2Apache Spark 2.2.0
2017-12-14 00:00:00 1416
原创 四种优化 Apache Flink 应用程序的方法
如果下面文章格式或图片不清晰,请参见原文:https://www.iteblog.com/archives/2303.html 或直接点击下面 阅读原文 即可进入。Flink 是一种非常复杂的框架,它提供了多种调整其执行的方法。本文将介绍四种不同的方法来提升你的 Flink 应用程序的性能。使用 Flink Tuples当你使用类似于 groupBy, join, 或者 keyBy 算子时,Fli
2017-12-12 00:00:00 2327
转载 奇虎360正式开源深度学习调度平台XLearning
本文系奇虎360系统部相关工程师投稿。近两年人工智能技术发展迅速,以Google开源的TensorFlow为代表的各种深度学习框架层出不穷。为了方便算法工程师使用各类深度学习技术,减少繁杂的诸如运行环境部署运维等工作,提升GPU等硬件资源利用率,节省硬件投入成本,奇虎360系统部大数据团队与人工智能研究院联合开发了深度学习调度平台——XLearning。XLearning平台将大数据与深度学习相融
2017-12-09 00:00:00 2419
转载 上海(Shanghai) Apache Spark Meetup第十四次聚会
第十四次Shanghai Apache Spark Meetup聚会,由中国平安银行大力支持。活动将于2017年12月23日12:30~17:00在上海浦东新区上海海神诺富特酒店三楼麦哲伦厅。举办地点交通方便,靠近地铁4号线浦东大道站。座位有限,先到先得。大会主题《Spark在金融领域的算法实践》(13:20 – 14:05)演讲嘉宾:潘鹏举,平安银行大数据平台架构师,曾供职于携程、尼尔森等公司担
2017-12-07 00:00:00 1577
原创 Spark作业如何在无管理权限的集群部署Python或JDK
如果下面文章格式或图片不清晰,请参见原文:https://www.iteblog.com/archives/2296.html 或直接点击下面 阅读原文 即可进入。在 《如何在Spark、MapReduce和Flink程序里面指定JAVA_HOME》文章中我简单地介绍了如何自己指定 JAVA_HOME 。有些人可能注意到了,上面设置的方法有个前提就是要求集群的所有节点的同一路径下都安装部署好了 J
2017-12-06 00:00:00 1321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人