![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
xiang-fish
这个作者很懒,什么都没留下…
展开
-
小试 scrapy
我们使用dmoz.org这个网站来作为小抓抓一展身手的对象。首先先要回答一个问题。问:把网站装进爬虫里,总共分几步?答案很简单,四步:新建项目 (Project):新建一个新的爬虫项目明确目标(Items):明确你想要抓取的目标制作爬虫(Spider):制作爬虫开始爬取网页存储内容(Pipeline):设计管道存储爬取内容好的,基本流转载 2016-08-11 15:04:11 · 428 阅读 · 0 评论 -
beautifulsoup 简介
beautifulsoup 有下列3个对象BeautifulSoupTagNavigableStringBeautifulsoup对象的创建创建一个BeautifulSoup对象是任何Beatutiful Soup工程的第一步。 BeatutifulSoup对象的创建可以通过一个字符串或一个类文件对象(可以是一个储存在本地的文件句柄或一个web网页句柄)1.用字符串创建Beautiful原创 2016-08-12 15:25:19 · 788 阅读 · 0 评论