现在的做法是把文件读进来,逐个解析每一个byte,如果有一个byte<0那么断定这个文件是二进制的,这在纯英文的环境下可以工作,但是如果一个文本包含了中文字符,那么这个文件也会被判断为二进制文件。
我在网上看看到有人也是逐个比较每一个byte,只不过是如果有一个byte=0就判断为二进制文件,这样做有依据吗?
大家有没有什么解决办法?
我在网上看看到有人也是逐个比较每一个byte,只不过是如果有一个byte=0就判断为二进制文件,这样做有依据吗?
大家有没有什么解决办法?