爬虫
Jorocco
爬行者!
展开
-
python爬虫——正则表达式及urllib的使用
1、正则表达式#!/usr/bin/python# -*-coding:utf-8-*-# __author__ = 'ShenJun'import re'''par="yue"string="http://yum.iqianyue.com"rst1=re.search(par,string)#从string中匹配字符串"yue"p原创 2018-05-21 14:14:58 · 1753 阅读 · 0 评论 -
Python爬虫————scrapy的使用
1、什么是scrapy scrapy是Python开发的一个快速、高层次的屏幕抓取和web抓取的爬虫框架,用于抓取web站点并从页面中提取结构化的数据。 2、Scrapy的安装 也可以通过Anaconda安装可避免以上的坑3、常用的基本命令建立一个scrapy工程:scrapy startproject pro进入工程目录建立一个scrapy爬虫:cd p...原创 2018-05-21 14:14:41 · 830 阅读 · 0 评论