SPARKSQL读SPARK表

SPARK2.0.2版本

1. 读取SPARK表

创建sparkSession,执行SQL,每行记录输出Object[],再对每行记录做转换,增加时间戳

public RDD<WindowedValue<Object[]>> getSourceRDD(PipelineOptions pipelineOptions, SparkContext sparkContext)
    {
      SparkSession sparkSession = SparkSession.builder().appName("XXX").master(sparkContext.master())
        .enableHiveSupport().getOrCreate();


      sparkSession.sql("use  " + this.read.database); //数据库名,默认是default
      Dataset rowset = sparkSession.sql(this.read.sql); //SQL 语句
      RDD rows = rowset.rdd().map(new JavaMapRow2ObjectArray()
      {
        public Object[] call(Row row) {
          Object[] colArr = new Object[row.size()];
          for (int i = 0; i < row.size(); ++i) {
            colArr[i] = row.get(i);
          }
          return colArr; }
      }
      , ScalaUtil.getClassTag([Ljava.lang.Object.class));


      RDD windowrows = rows.map(new JavaMap2WindowValue()
      {
        public WindowedValue<Object[]> call(Object[] record) {
          return WindowedValue.timestampedValueInGlobalWindow(record, BoundedWindow.TIMESTAMP_MIN_VALUE); }
      }
      , ClassTag..MODULE$.apply(WindowedValue.class));


      return windowrows;
    }


转换函数类,用于给每行记录加时间戳

public abstract class JavaMap2WindowValue<T> extends AbstractFunction1<T, WindowedValue<T>>
  implements Serializable
{
  public WindowedValue<T> apply(T record)
  {
    return call(record);
  }


  public abstract WindowedValue<T> call(T paramT);
}


工具类

public class ScalaUtil
{
  public static <T> ClassTag<T> getClassTag(Class<T> clazz)
  {
    return ClassTag..MODULE$.apply(clazz);
  }


  public static <K, V> ClassTag<Tuple2<K, V>> getTuple2ClassTag()
  {
    return ((ClassTag)getClassTag(Tuple2.class));
  }


  public static <T> Seq<T> toScalaSeq(List<T> list) {
    return JavaConversions.asScalaBuffer(list);
  }


  public static void main(String[] args) {
    System.out.print(ClassTag..MODULE$.apply(Tuple2.class)); }


  public static <T> Manifest<T> getManifest(Class<T> clazz) {
    return ManifestFactory.classType(clazz);
  }
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值