网络爬虫
Lavi_qq_2910138025
这个作者很懒,什么都没留下…
展开
-
Scrapy选择器Selector
当抓取网页时,常见的任务是从HTML源码中提取数据。现有的一些库可以达到这个目的: BeautifulSouplxml Scrapy 提取数据有自己的一套机制。它们被称作选择器(seletors),因为他们通过特定的 XPath 或者 CSS 表达式来“选择” HTML 文件中的某个部分。 构造选择器 Scrapy selector 是以 文字(Text)或 TextR转载 2017-05-01 19:43:32 · 1577 阅读 · 0 评论 -
python爬虫爬取内容中,\xa0,\u3000的含义
本文讲解了在使用python爬取数据时常见的\xa0、\u3000的含义转载 2017-05-01 21:41:59 · 4760 阅读 · 0 评论