最近做数据清洗,对某个字段进行操作,要求是替换字段里 的括号及括号内容,其中括号存在中文括号和英文括号,以及半个括号,因为涉及的括号不同,处理方法也不同。
具体情况如下
company_name 卓力(集团) --中文括号 卓力(集团) -- 英文括号 卓力(集团 -- 半个英文括号 卓力(集团 -- 半个中文括号
1、 处理中英文括号,用替换函数将括号及括号里的内容 ,全部替换为空
regexp_replace(company_nme,'\\(.*?\\)|\\(.*?)', '') as company_name_01
2、处理英文半个括号,需要用到解析函数
regexp_extract(company_nme,'(.*)\\(') as company_name_01
3、处理中文半个括号
regexp_extract(company_nme,'(.*)()') as company_name_01