目录
闲来无事, 处理一下正则表达式去除字符串两边的标点符号
python
s=""""''& _+-' ..?奶?面包0Python 学习笔记之编码问题unicode、encode、decode - 豆.瓣a_b_ ?'、。 *&^%$#@!-=++_,"""
s
'"\'\'& _+-\' ..?奶?面包0Python 学习笔记之编码问题unicode、encode、decode - 豆.瓣a_b_ ?\'、。 *&^%$#@!-=++_,'
import re
s=re.sub("^([^\w]|_)+|([^\w]|_)+$",'',s)
s
'奶?面包0Python 学习笔记之编码问题unicode、encode、decode - 豆.瓣a_b'
hive
SELECT regexp_replace("& _+-' ..奶面包0Python 学习笔记之编码问题unicode、encode、decode - 豆.瓣a_b_ ?'、。 *&^%$#@!-=++_,","^([^\\w\\u4E00-\\u9FFF]|_)+|([^\\w\\u4E00-\\u9FFF]|_)+$","")
奶面包0Python 学习笔记之编码问题unicode、encode、decode - 豆.瓣a_b
pyspark
pyspark调用hive时, 将\\变为\\\\, 如 \\s 变为 \\\\s .