20220113
re.sub(/[^\d.]/g,"")
只保留数字和小数点
aa = 'niihdfa(dafef).2.5'
bb = 'niihdfa(dafef)'
# bb = re.sub(r'[^\d.]','',aa)
aa = re.sub(r'\(.+\)', '', aa)
括号的匹配并删除包括括号在内的所有字符
20210319
匹配三组
给每个匹配取名字
line=line.strip(’ ‘) #去除两端空格
line=line.replace(’{none}’,’’)
line=line.replace(’ ‘,’’)
line=line.replace(’’,’’)
line=line.replace(’’,’’)
line = line.replace(’"’, ‘’)
line = line.replace(’?’, ‘’)
line = line.replace(’{COL}’, ‘’)
re_fenhao= re.compile(’&(.?);’)
line=re_fenhao.sub(’’,line)
reExp=re.compile(’<(.?)>’) #去掉尖括号
line=reExp.sub(’’,line)
re_space=re.compile(’\s{1,}’)#去掉空格
line=re_space.sub(’ ‘,line)
re_ques=re.compile(’?{1,}’)#去掉多个问好
line=re_ques.sub(’’,line)
re_zhongkuohao_l=re.compile(’{’)#去掉中括号
line=re_zhongkuohao_l.sub(’’,line)
re_zhongkuohao_r = re.compile(’}’)
line = re_zhongkuohao_r.sub(’’, line)#
line=line.strip(’ ') #去除两端空
zhongw=re.compile( ‘[\u4e00-\u9fa5]’) 匹配汉字