首先本文是基于win7操作系统,并且配置好scrapy的运行环境,采用Python语言编写的(前面有疑问的请先Google,百度 ,拒绝伸手党)
1.假设你已经配置好scrapy的运行环境,这里你只需要运行CMD进入DOS创建一个新的项目工程
scrapy startproject 项目名称 项目名称改成你的 具体名称
我们可以看到创建好的目录的树形图,里面需要修改的items.py , pipelines.py setting.py 另外spiders文件夹下需要编写自己的爬虫文件(新建spiders.py)
2.这里就以抓取某网站的产品信息为例子编写
items.py文件如下
# -*- coding: utf-8 -*-
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html
from scrapy.item import Item, Field
class ComputerItem(Item):
# define the fields for your item here like:
# name = scrapy.Field()
name=Field(serializer=str)#产品名称1
price=Field(serializer=str)#产品价格2
jprice=Field(serializer=str)#
#gprice=Field(serializer=str)#
#sprice=Field(serializer=str)#二手价5
score=Field(serializer=str)#评分6
screval=Field(serializer=str)#屏幕效果7
buffval=Field(serializer=str)#电池续航8
phtval=Field(serializer=str)#拍照效果9/运行速度
yuval=Field(serializer=str)#娱乐10
desval=Field(serializer=str)#外观设计效果11
cpval=Fie