产生parquet数据
这里通过Spark SQL来从CSV文件中读取数据,然后把这些数据存到parquet文件去。
SparkContext context = new SparkContext(new SparkConf().setMaster("local").setAppName("parquet"));
SQLContext sqlContext = new SQLContext(context);
DataFrame dataFrame = sqlContext.read().format("com.databricks.spark.csv")
.option("header","true") //这里如果在csv第一行有属性的话,没有就是"false"
.option("inferSchema","true")