![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
dandd31
这个作者很懒,什么都没留下…
展开
-
Python_Scrapy_7.回调函数
http://www.cnblogs.com/berlin-sun/p/callbackinpython.html http://www.zhihu.com/question/19801131原创 2015-06-19 16:17:41 · 1638 阅读 · 0 评论 -
Python_Scrapy_8.爬虫
终于学到重头戏了,开始要写爬虫了. 大多数的解释在官方教程上都有. import scrapy class DmozSpider(scrapy.spider.Spider): name = "dmoz" allowed_domains = ["dmoz.org"] start_urls = [ "http://www.dmoz.org/Computers原创 2015-06-21 18:03:41 · 524 阅读 · 0 评论 -
Python_Scrapy_9.网页 HTML CSS
爬虫最关键的就是数据提取,我每次都要在网页解析和数据提取上花掉大量的时间,我之前写一个单线程的爬虫90%的时间都花在这里.在加上对网页制做也挺有兴趣的所以打算花点时间稍微深入的学习下. 如果想深入学习的可以去w3c上看教程,但是这里我使用了入门级的教程: 计蒜客, 以下是我的学习心得. 0.基本知识 网页:就是HTML文档. URL:URL就是网址,网址的本质就是IP地原创 2015-06-23 13:54:50 · 538 阅读 · 0 评论