【spark】编程代码,随笔记录

  • spark-yarn模式
    –master yarn-cluster
    (只需在spark-submit执行时,添加参数)

  • 速度慢:
    提升cores数(提升并行执行的task);

  • 使用spark-rdd,textFile基于本地系统,linux系统,路径格式简介:
    //hdfs单个文件夹
    val onePath = "hdfs://100.38.101.2:9000//log/month=01/new1.txt"
    //hdfs下所有的month文件夹下的所有txt文件(使用通配符*表示)
    val monAllPath = "hdfs://100.38.101.2:9000//log/month=*/*.txt"
    // hdfs两个文件夹month为10/09下的所有txt文件(使用","隔开)
    val morePath="hdfs://100.38.101.2:9000//log/month=10/*.txt,hdfs://100.38.101.2:9000//log/month=09/*.txt"
    //读取本地文件
    val localPath = "D:/zling/test.txt"
    //读取linux系统下文件
    val liPath = "/root/zling/test.txt"
    //读取路径下的文件
    sc.textFile(onePath).map(line => {})

小编会不定时更新,欢迎大家来撩

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值