要抓取淘宝店铺的内容只能是通过传过来的淘宝URL来抓取。所以我们先要有一个URL。
有了URL之后就可以开始抓取工作了。根据URL的域名不同需要把URL分成两个部分,一个是淘宝的店铺,一个是天猫的店铺。截取URL的域名这里就不说了,大家不会的自行百度。之所以这么做是因为淘宝和天猫的店铺DOM结构是不一样的。
先说简单的天猫。
天猫的店铺等级在一个class名为tm-shiop-age-content中,所以用phpQuery的pq('.tm-shiop-age-content')->text()可以直接获取天猫店铺的等级。
然后就是店铺的评分。
天猫店铺的评分是在一个class为main-info的div中,所以也是直接