一、构思主体
主要分为save_html、catch_text以及run三部分。run为运行函数,可忽略。
- save函数主要用于抓取目录以及目录url。
<ul class="MLlist">
<li><a href="/1bqgread/881589145/49381955.html" one-link-mark="yes">**********</a></li>
<li><a href="/1bqgread/881589145/49381956.html" one-link-mark="yes">**********</a></li>
</ul>
网页源码如上,通过分析可以利用
“xpa