scala读取HDFS文件,每次读取一定的字节数

本文介绍了如何使用Scala编程语言从HDFS(Hadoop分布式文件系统)中读取文件,特别是每次读取指定数量的字节。内容涵盖了相关的方法和技巧,帮助读者理解并实现这一功能。
摘要由CSDN通过智能技术生成
用scala读取一个只有字符的文件,该文件是已经清洗完的数据,有规律,一行是一条数据。
现在的需求是一次读取文件中的一部分,依次读取完。
 
 
如果有疑问,或者找出错误的解决方案,请和我联系。一起研究讨论
  
  
  
[plain] view plain copy
  1. import java.io.IOException  
  2. import java.net.URI  
  3.   
  4. import org.apache.hadoop.conf.Configuration  
  5. import org.apache.hadoop.fs.{FSDataInputStream, FileSystem, Path}  
  6.   
  7. /**  
  8.   * Created by wx on 2017/7/20.  
  9.   */  
  10. object HDFSUtil {  
  11.   val conf: Configuration = new Configuration  
  12.   var fs: FileSystem = null  
  13.   var hdfsInStream: FSDataInputStream = null  
  14.   
  15.   def getFSDataInputStream(path: String): FSDataInputStream = {  
  16.     try {  
  17.       fs = FileSystem.get(URI.create(path), conf)  
  18.       hdfsInStream = fs.open(new Path(path))  
  19.     } catch {  
  20.       case e: IOException => {  
  21.         e.printStackTrace  
  22.       }  
  23.     }  
  24.     return hdfsInStream  
  25.   }  
  26.   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值