spider
文章平均质量分 71
xix_hu
这个作者很懒,什么都没留下…
展开
-
spider
crapy startproject BaiyiSpider 正则表达: +:出现一次 {2} 其前面字符出现2次 {2,5} 最少两次,最多五次 {3,} 不少于3次 | 或原创 2018-02-06 15:49:52 · 279 阅读 · 0 评论 -
python 安装虚拟环境
pip install virtualenv 使用豆瓣源,加快速度,避免超时。 例如: pip intall -i https://pypi.douban.com/simple/ django 创建虚拟环境: virtualenv scrapytest 进入://运行activate,bat文件 cd Scripts activate.bat 直接输入python命令,可原创 2018-02-06 17:16:03 · 209 阅读 · 0 评论 -
爬虫基础知识回顾一
一、 二、正则表达: 可完成:例如:1天前 取出 1 ^b.* ^b 以b开头 . 任意一个字符 *可出现多次 import re line = "qbssqbss" regex_str = "^qb.*" if re.match(regex_str, line): print("yes") :以....结尾&原创 2017-12-27 16:29:56 · 1147 阅读 · 0 评论 -
XPath
https://cuiqingcai.com/2621.html XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历. 在下面的例子中,book 元素是 title、author、year 以及 price 元素的父: 节点关系:父、子、同胞、先辈、后代、 表达式 描述 nodename ...原创 2018-02-08 10:52:39 · 217 阅读 · 0 评论