只有utf8编码的中文才可以被识别。 unix/linux下的文本默认是以 0x0A 作为一行的结束,而dos/win下的文本是默认以 0x0D0A 两个字节作为一行的结束,不过dos格式的在linux下也是可以认的。