采集分页
我们在采集文章的时候,有时候在文章页会碰到分页的情况,那么这样,就要尝试去采集分页了,如下图所示。
正文分页html代码
现在,应该找到这篇文章所对应的代码在什么位置,如图:
那么,现在就需要在分页规则里面进行设置了,如图:
好了,采集成功,采集后的文章在分页处将以分页形式显示了。
采集不了的网站
有些时候,会遇到一些采集不了的网站,什么样的网站是采集不了的呢,经过采集,发现有这样的网站采不了内容。在采集文章之前,必希要查看网页的源代码,
<meta name="Keywords" content="" /> | |
<meta name="description" content="治好牙病再怀孕(图)" /> |
<meta content="怀孕" name="keywords" /> | |
<meta content="亲亲宝贝网怀怀孕频道,全面介绍怀孕常识,提供准妈妈怀孕期间最全的保健、饮食资讯。其中介绍怀孕的症状、孕妇饮食、孕妇保健、胎儿发育、流产胎停、孕妇疾病 、孕期疾病和孕期运动等内容,让你健康轻松怀孕分娩和产后护理。"name="description" /> |