#获取数据后,会有各类的特殊字符需要删除
import retemp = “想做/ 兼_职/学生_/ 的 、加,我Q: 1 5. 8 0. !!?? 8 6 。0. 2。 3 有,惊,喜,哦”
temp = temp.decode(“utf8”)string = re.sub("[\s+.!/_,$%^(+"’]+|[+——!,。?、~@#¥%……&()]+".decode(“utf8”), “”.decode(“utf8”),temp)
print string
new_str = re.sub(’[^\w\u4e00-\u9fff]+’, ‘’,‘江苏 » 无锡市:婚礼司仪roger’)
个人问题 我想要纯中文的歌词,不想要歌词中的 oh oh oh 这些。。。还有特殊符号需要删除 纯粹中文
{ "id" : { "KaTeX parse error: Expected 'EOF', got '}' at position 35: …b976548aa1503" }̲, "singer" : "阿…%&’()*+,-./:;<=>?@,。?★、…【】《》?“”‘’![\]^`{|}~\s]+’,’’, new_str)