Python_Scrapy_9.网页 HTML CSS
爬虫最关键的就是数据提取,我每次都要在网页解析和数据提取上花掉大量的时间,我之前写一个单线程的爬虫90%的时间都花在这里.在加上对网页制做也挺有兴趣的所以打算花点时间稍微深入的学习下.
如果想深入学习的可以去w3c上看教程,但是这里我使用了入门级的教程: 计蒜客, 以下是我的学习心得.
0.基本知识
网页:就是HTML文档.
URL:URL就是网址,网址的本质就是IP地
原创
2015-06-23 13:54:50 ·
538 阅读 ·
0 评论