当我们从一个文件,比如excel中,读取数据时,由于编码等各种问题,有时会导致我们读出来的字符串中包含着一些奇怪的字符,比如?>等等。
可以通过正则表达式来去掉这些奇怪的字符:
s = s.replaceAll("[^\u4e00-\u9fa5a-zA-Z0-9]", "");
其中, \u4e00-\u9fa5表示中文。
当我们从一个文件,比如excel中,读取数据时,由于编码等各种问题,有时会导致我们读出来的字符串中包含着一些奇怪的字符,比如?>等等。
可以通过正则表达式来去掉这些奇怪的字符:
s = s.replaceAll("[^\u4e00-\u9fa5a-zA-Z0-9]", "");