hive-sql截取汉字、字母和数字等

前几天新接到需求,要求截取字段里的汉字,截取字母、数字、特殊字符都简单,但是截取汉字的还是第一次遇见,查到汉字的编码,实验截取,在这里把代码发下,以备有需要的小伙伴使用。
在查询字段中截取汉字、字母和数字等代码如下:

regexp_extract(label,'([\\u4E00-\\u9FA5]+)',1)      windows下的截取汉字

regexp_extract(label,'([\\\u4E00-\\\u9FA5]+)',1)    linux下的截取汉字(比windows下多了一个转义符\)

regexp_extract(label,'([a-zA-Z0-9]+)',1)            截取字母和数字

select regexp_replace("2018-09-12",'-',"")          指定字符串的替换或删除(日期格式转换 20180912)注:hive里replace不可用
  • 7
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值