第一种方式:
val rdd = sc.newAPIHadoopFile("path/*.lzo",classOf[com.hadoop.mapreduce.LzoTextInputFormat],
classOf[org.apache.hadoop.io.LongWritable],classOf[org.apache.hadoop.io.Text]).map(_._2.toString)
第二种方式:
val rdd = sc.newAPIHadoopFile[LongWritable, Text, LzoTextInputFormat]("path/*.lzo").map(_._2.toString)