hive 字符串中包含中文及特殊字符的处理 数据背景 show me code result 以上 数据背景 在工作中, 会出现的字符串数据处理的问题, 包括数据中是否包含什么特殊字符/中文场景; 提取出字段中的中文/特殊字符等问题. 现总结如下: show me code select regexp_extract('什么【tmd】叫什么tmd的惊喜','([^\\x{00}-\\x{ff}]+)') --提取出[首段]中文和字符 ,regexp_extract('什么【tmd】叫什么tmd的惊喜', '([\\x{4e00}-\\x{9fa5}]+)') --提取[首段]中文 ,regexp_replace