Linux下grep搜索不同编码格式(GBK/UTF-8)的中文
一般情况下linux默认是utf-8的编码格式,但windows下是GBK或GB2312格式的编码,以及source insight不支持utf-8,通过共享的形式编辑linux里的代码会保存成GB2312格式,这样通过grep -rn '中文' * 是无法把GB2312格式文件中的‘中文’检索出来的。
网上搜索很多,主要是说:当要查找汉字“中文”(utf-8编码和gb2312编码分别是E4B8ADE69687和D6D0CEC4)时,使用grep -rnP "\xE4\xB8\xAD\xE...
原创
2021-08-03 17:44:47 ·
5822 阅读 ·
0 评论