很常见的一种问题就是
抓取的目标网站编码是gb2312
而存入数据库的编码是utf8
这是如果你iconv('gb2312','UTF-8',$body)后再抓取的话
可能会出现抓取不到的情况
原因就是在转码的过程中网站内容可能已经改变了
这是有两种方法可以尝试
1。将gb2312编码换成GBK编码,再iconv('GBK','UTF-8',$body),经过试验,这种方法可以抓取到数据
2. 先不要转码,而将你的所有文件编码跟网站编码统一,抓取完后在存入数据库之前再转码成数据库的编码