Hive 正则提取英文名称和中文名称
hive --version
Hive 2.3.3
提取英文名称
select regexp_extract("Aptamil 爱他美(德国)",'([A-Z][a-z]*(\\s|$))+', 1);
select regexp_extract("Skin 伊思",'(\\w*(\\s|$))+', 1);
select regexp_extract("SKIN 伊思",'(\\w*(\\s|$))+', 1);
提取中文名称
select regexp_extract("Aptamil 爱他美(德国)",'([\u4E00-\u9FFF]+)', 1);
select regexp_extract("Skin 伊思",'([\u4E00-\u9FFF]+)', 1);
select regexp_extract("SKIN 伊思",'([\u4E00-\u9FFF]+)', 1);
参考文档
我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3ckgexxns8g0o