每次使用或者建表后要refresh db(增加了表),和refresh tablename(改了表结构);
hudi同步到hive需要几分钟,需要等下(不等待可以刷新hive元数据,hudi和hive共用元数据)
删除hudi表:
删除表不算完全删除,重建这个表会报错,要删除表的话,需要把hdfs也删了(指定了location会生产外部表)
不指定location会生产内部表,可以删除
create table hudi.test(
a string
) using hudi
options (
primaryKey = 'a',
type = 'cow'
)
Spark进入Hudi
spark-sql --jars /app/hudi-spark-bundle_2.11-0.10.0.jar
--conf 'spark.serializer=org.apache.spark.serializer.KryoSerializer'
--conf 'spark.sql.extensions=org.apache.spark.sql.hudi.HoodieSparkSessionExtension'
创建Hudi表
create table TMP_CAMP_ORDER_DTL_03 (
SALE_ID STRING
,PROP_CNST_ID STRING
,PROP_CNST_CD STRING
,PROP_CNST_NM STRING
,SHARE_RATE STRING
)using hudi
options (
primaryKey = 'SALE_ID,