网上的解决办法说抓取后用iconv()转码。看后我就觉得不对劲:一个是不一定编译了iconv库,更大的问题是编码都跟流转换的时候有关(如果用了iconv实际上php转了两次码:流->UTF-8->GB2312):这不是白忙乎了吗?
仔细看了下php的文档(不知道大家都是怎么写代码的,其实文档上很清楚啊),上面关于fopen()及file_get_contents()都提到了“默认是UTF-8,但是用户可以用stream_default_encoding()或者用户自定义上下文属性改变编码”(Ifunicodesemanticsareenabled,thedefaultencodingofthereaddataisUTF-8.Youcanspecifyadifferentencodingbycreatingacustomcontextorbychangingthedefaultusingstream_default_encoding().)。于是用stream_default_encoding('gb2312′);测试:但是faint的是,这个函数不存在?!似乎php6才支持。不过天无绝人之路,还有“用户自定义上下文属性”可以用。
经过更仔细的看文档,最后解决了这个问题:
复制代码代码如下:
//设置流的编码格式,这是文件流(file),如果是网络访问,file改成http
$opts=array('file'=>array('encoding'=>'gb2312'));
$ctxt=stream_context_create($opts);
file_get_contents(文件名,FILE_TEXT,$ctxt);
您可能感兴趣的文章:php读取二进制流(C语言结构体struct数据文件)的深入解析PHP读取文件内容的五种方式php读取本地文件常用函数(fopen与file_get_contents)PHP读取txt文件的内容并赋值给数组的代码PHP读取网页文件内容的实现代码(fopen,curl等)php逐行读取txt文件写入数组的方法用PHP读取超大文件的实例代码php读取文件内容到数组的方法PHP实现类似于C语言的文件读取及解析功能