正则表达式
文章平均质量分 59
永远在减肥永远110的的小潘
这个作者很懒,什么都没留下…
展开
-
HIVE SQL中替换不可见字符的正则表达式
正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。这个时候通常会使用正则表达式来替换字符串中的空白字符。函数,但是他们无法去除字符串中间的空格。对于剔除字符串首尾的空格,使用较多的是。在实际清洗过程中,发现即使使用了。进一步对不可见字符进行处理。原创 2023-07-17 14:48:36 · 2020 阅读 · 0 评论 -
HIVE SQL使用regexp_replace正则替换敏感身份证信息
hql 使用正则替换敏感身份证号信息原创 2022-08-22 23:40:53 · 1918 阅读 · 0 评论 -
Python正则表达式之提取指定字符串内容后的数值
需求:提取散装商品斤重统计表格中describe列中高值、高高值、中值的斤重describe列样例如下,高值、高高值、中值分别对应不同的价格分类,我们需要提取不同价格的斤重,以计算总的销售额。如果只是几行这样的记录,直接人工提取就很方便了。样例中可以看出高值3斤,高高值2斤,中值1斤。但是如果有很多这样的行记录,人工取值在这里显然是行不通了,这里考虑使用正则表达式模糊匹配后来提取数值。这里需要提醒的一项是,每行记录不一定三种值的斤重都存在,有可能仅存1种或者2种值的斤重,但不同价格分类只会对应一个斤重。原创 2022-01-08 20:42:55 · 9164 阅读 · 0 评论 -
Python正则表达式之提取字符串中中文和数值
Python正则表达式之提取字符串中指定值提取中文提取数值提取整型数值提取浮点型数值提取整型和浮点型数值提取中文import repattern=re.compile("[\u4e00-\u9fa5]+")pattern.findall("士力架花生夹心巧克力全家桶460g/+40克(20克*2)500g")输出:[‘士力架花生夹心巧克力全家桶’, ‘克’, ‘克’]提取数值提取整型数值import repattern=re.compile("[0-9]+")pattern.find原创 2021-03-10 16:30:42 · 3528 阅读 · 2 评论 -
Python正则表达式之初识正则表达式
一、正则表达式正则表达式(Regular Expressions):一种字符串匹配模式,达到一种类似于模糊查询的效果。Python中通过调用re库import re引入正则模块后可进行相关匹配操作。二、re库常用函数1、re.search()与Python自带的字符串函数find()类似,find()在字符串中寻找指定的字符串的位置,并返回该字符串首次出现的首字母的索引。如果字符串未找到,返回-1。s='hello's.find('o')输出:4re.search()中如果匹配字符串未找原创 2020-06-18 20:55:00 · 254 阅读 · 0 评论