QueryList是一套用于内容采集的PHP工具,具体的好处用过的人就知道,具体的不多说,有兴趣的可以到官网详细了解,直通车:http://www.querylist.cc/docs/guide/v4/overview
在采集图片的时候,很多时候会直接通过img的src属性来获取图片链接,但是很多时候是采集不到地址的,造成的原因也很多,
比如这个
按照手册的说法直接
$rules=[
"img"=>['.news_list1 .left img',"src"]
];
即可,但是真正采集的时候是采集不到的,因为这个代码是经过处理的,真实代码是
所以真实代码应该是
$rules=[
"img"=>['.news_list1 .left img',"originalsrc"]
];
这样才能采集到的,属性的明确才能真正原因。
也有一些是直接是放到js代码里面最后面才去加载替换,这个也是很多网站防采集的一个手段,这个要采集的话就会比较复杂,这个时候就要用到另外的手段了,这里就不细说了,有兴趣的都可以去研究下