import re pattern = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]') pattern.sub('',text) 思路:主要是匹配表情包的范围,将表情包的范围用空替换掉