最近在处理excel表格数据时发现数据特别杂乱,在商务给的excel表格中发现在手机号这一列居然还有中文字符和英文字符 在向mongo中存储的时间需要格式统一,这在清洗的时间应该怎么给去除呢,后来发现可以使用python中的dumps和loads 方法可以实现。 首先我们需要导入json库,然后来调用dumps的方法把需要处理的字符给转换成对应的ASSCII字符 然后我们可以看到对应的中文字符都是以u开头,我们只需要把对应的中文字符给替换掉就ok 接下来就是替换中文字符了,但是中文那么多的汉字,每一个汉字对应的字符都不一样,我们怎么替换呢,其实我们只需要使用re正则里面的sub()方法就可以完成相对应的替换工作。我替换了对应的中英文,只留下了手机号。然后使用json.loads()方法把ASSCII编码给转换回字符串就完成了中文和英文的清洗工作。 替换后的结果就只剩下了手机号码