使用较少!!!使用较少!!!使用较少!!!
为什么?看看官方怎么说
官方说的局限
一般不用,给钱也不用,除非给的足够多
V0.14版本开始支持行级事务
支持INSERT、DELETE、UPDATE(v2.2.0开始支持Merge)
局限
文件格式只支持ORC
表必须是bucketed表
需要消耗额外的时间、资源和空间
不支持开始、提交、回滚、桶或分区列上的更新
锁可以为共享锁或排它锁(串联的而不是并发):HDFS不支持并发读写,尤其是写操作
不允许从一个非ACID连接读写ACID表
有那么多问题你还想用Hive事务?
加钱后使用方式
1、设置好配置
set hive.support.concurrency = true;
set hive.enforce.bucketing = true;
set hive.exec.dynamic.partition.mode = nonstrict;
set hive.txn.manager = org.apache.hadoop.hive.ql.lockmgr.DbTxnManager;
set hive.compactor.initiator.on = true;
set hive.compactor.worker.threads = 1;
2、创建分桶表和存储为ORC文件
create table tb_bucket_student(
stu_id int,
stu_name string
)
clustered by (stu_id) into 2 buckets
row format delimited
fields terminated by '|'
lines terminated by '\n'
stored as orc
tblproperties("transactional"="true");
插入
insert into tb_bucket_student values(1,'Tom'),(2,'Jerry'),(3,'Jack');
就可以update和delete指定记录了
但是 update和 delete数据的时间比 insert都慢的多的多