用PHP抓数据时,会遇到浏览器能打开URL,爬虫却返回不了数据。
这时候就可能是该URL有手机端版本,而PHP默认是不带浏览器信息的,就可能返回的是手机端页面。
可以在程序头部加入:
ini_set(‘user_agent’,’Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; 4399Box.560; .NET4.0C; .NET4.0E)’);
这里模拟的是IE8,更多浏览器标识可以百度。
附:关于ini_set()方法
PHP ini_set用来设置php.ini的值,在函数执行的时候生效,脚本结束后,设置失效。无需打开php.ini文件,就能修改配置,对于虚拟空间来说,很方便。
函数格式:string ini_set(string