- 博客(3)
- 资源 (5)
- 收藏
- 关注
原创 spark简介
Apache Spark项目于2009年诞生于伯克利大学的AMPLab实验室,当初的目的在于将内存内分析机制引入大规模数据集当中。在那个时候,Hadoop MapReduce的关注重点仍然放在那些本质上无法迭代的大规模数据管道身上。想在2009年以MapReduce为基础构建起分析模型实在是件费心费力而又进展缓慢的工作,因此AMPLab设计出Spark来帮助开发人员对大规模数据集执行交互分析、从而
2017-08-22 21:23:30 284
原创 ssh command一台主机同时给多台主机远程操作
机器列表:host0,host1, host2,host3,host4,host5实现功能:在host0上面对其他机器执行指令 1、实现host0可以免密码登录host1-host5,这个可以自行百度 2、在host0的home目录下新建文件.scmd.sh如下:#!/bin/shpaserArgs(){ OLD_IFS="$IFS" IFS="," arr=($1)
2017-08-19 15:52:51 7228
原创 spark读取mongodb(maven)
org.mongodb.spark mongo-spark-connector_2.11 2.0.0 org.apache.spark spark-sql_2.11 2.0.0import com.mongodb.spark._import com.mongodb.spark.config.ReadConfigimport org.
2017-08-15 10:02:05 3218
快学Scala(中文完整版)
2018-01-19
推荐系统实战
2018-01-19
算法导论(第三版)
2016-12-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人