
爬虫
Jorocco
爬行者!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python爬虫——正则表达式及urllib的使用
1、正则表达式 #!/usr/bin/python # -*-coding:utf-8-*- # __author__ = 'ShenJun' import re ''' par="yue" string="http://yum.iqianyue.com" rst1=re.search(par,string)#从string中匹配字符串"yue" p原创 2018-05-21 14:14:58 · 1951 阅读 · 0 评论 -
Python爬虫————scrapy的使用
1、什么是scrapy scrapy是Python开发的一个快速、高层次的屏幕抓取和web抓取的爬虫框架,用于抓取web站点并从页面中提取结构化的数据。 2、Scrapy的安装 也可以通过Anaconda安装可避免以上的坑 3、常用的基本命令 建立一个scrapy工程: scrapy startproject pro 进入工程目录建立一个scrapy爬虫: cd p...原创 2018-05-21 14:14:41 · 987 阅读 · 0 评论