正则表达式的简单使用
第一天接触正则表达式,对那些鬼画符一样的符号很是头疼。今个在爬qq音乐排行榜歌的时候遇到个难题,文件名里有非法字符造成程序错误,其实使用正则表达式很好解决,但是我学艺不精,怎么也表达不好,造成其他歌曲的名字少字符或是别的情况,其实只需要用到re.sub()的一个最简单的用法就可以了,上代码
songName = re.sub('[<>??/\*|:"]', '', songName)
就是re.sub(‘[ ]’,‘’,str)把所有想去掉的非法字符都放到两个方括号中间就行了,真是简单粗暴。