手动删除/kylin hdfs 上的数据
使用kylin一段时间,不难发现kylin指定的work folder目录下存储的数据越来越多。我们在使用kylin时,由于数据模型设计及其他问题,多次数据回溯,导致kylin的work folder下存储量越滚越大。不得不手动清除。
kylin提供了清理的java类:org.apache.kylin.storage.hbase.util.StorageCleanupJob ,但是我在执行
${KYLIN_HOME}/bin/kylin.sh org.apache.kylin.storage.hbase.util.StorageCleanupJob --delete true
并没有发现删除kylin指定的work folder目录/kylin/kylin_metadata下的文件。
我是手动删除的:
首先到此目录下找到不要的cube及在此日期之前构建的(不是最后一次构建产生的数据需要删除的work folder)
然后到hbase中找到hbase_metadata表,查看cube元信息
删除不要的cube
deleteall 'kylin_metadata','/cube/C_PRODUCT_V1.json'
删除之前最好备份一下
./bin/metastore.sh backup