问题背景
接到反馈,某一项目代码有中文注释和非UTF-8编码格式的文件,要求处理这些中文注释,并把文件改为UTF-8的格式。
解决方案
查找中文字符
因为Visual Studio查找功能支持表达式,不希望一个个查找文件浪费时间,所以基本思路是使用正则表达式,对照输出结果在文件里修改。
但是,网上查找的正则表达式,如下,查找无效。
(".[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.")
修改测试后,使用以下正则表达式可以,希望能帮助到有需要的人。
[\u4E00-\u9FA5]+
查找设置如下:
修改文件编码
Visual Studio高级保存里面可以设置UTF-8编码,基本查找到的这些文件都是中文编码的,“另存为”保存的时候选择UTF-8即可。