python 遇到表情代码出错, 用正则表达式去掉表情代码

>>> aa = '\U0001f60a\adwkdkdkkdk'
# 这里“\U0001f60a” 这是表情的代码 带这个\
>>> import re
>>> cc = re.compile(r'\U0001f60a')
#cc 就是需要替换的代码 就是把不需要的先标记出来
>>> ff = re.sub(cc,'',aa)
#cc 是不要的‘’ 就是换成空白 aa 就是需要换的文本内容
>>> ff
'\x07dwkdkdkkdk'
#最后输出只有这个了 前2个表情都没有了

def gbk(con):

    while True:

        try:
            
            content = con.encode('gbk').decode('gbk')

            return content
                        
        except Exception as e:

            x = re.findall("er '(.+)' in",str(e))[0]
                            
            #print('程序出错',x)

            con = re.sub(x,'',con)


©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页