爬虫四个主要步骤:
1.明确目标:要爬取得目标网站;
2.爬:将所有的目标网站的内容全部爬(下载)下来;
3.取(过滤):在爬下来的网站内容中去掉对我们没有用处的数据,只留取我们需要的数据;
4.处理数据:按照我们想要的方式存储和使用留取的数据
爬虫四个主要步骤:
1.明确目标:要爬取得目标网站;
2.爬:将所有的目标网站的内容全部爬(下载)下来;
3.取(过滤):在爬下来的网站内容中去掉对我们没有用处的数据,只留取我们需要的数据;
4.处理数据:按照我们想要的方式存储和使用留取的数据
转载于:https://juejin.im/post/5a332b25f265da43305e810e