这个字符出现文本训练语料中。
首先是查找含有这个字符的文本:
grep -I -r -l $'\xEF\xBB\xBF' yourfilepath
只删除这个字符:
grep -I -r -l $'\xEF\xBB\xBF' yourfilepath | xargs sed -i 's/\xEF\xBB\xBF//g'
删除含有字符的哪一行:
grep -I -r -l $'\xEF\xBB\xBF' yourfilepath | xargs sed -i '/\xEF\xBB\xBF/d'