python中的scrapy爬虫_python 中scrapy爬虫问题

最新推荐文章于 2023-06-03 18:35:20 发布

weixin_39705069

最新推荐文章于 2023-06-03 18:35:20 发布

阅读量125

点赞数

文章标签： python中的scrapy爬虫

items模块如下：

import scrapy

class DoubanBookItem(scrapy.Item):

# define the fields for your item here like:

# name = scrapy.Field()

name = scrapy.Field()

price = scrapy.Field()

publisher = scrapy.Field()

ratings = scrapy.Field()

edition_year = scrapy.Field()

author = scrapy.Field()

paquspider.py 文件如下：

import scrapy

from douban_book.items import DoubanBookItem

class BookSpider(scrapy.Spider):

"""docstring for BookSpider"""

name = 'douban-book'

allowed_domain = ['douban.com']

start_urls = ['https://book.douban.com/top250']

def parse(self, response):

yield scrapy.Request(response.url, callback = self.parse_page)

for page in response.xpath('//div[@class="paginator"]/a'):

link = page.xpath('@href').extract()[0]

yield scrapy.Request(link, callback = self.parse_page)

def parse_page(self, response):

for item in response.xpath('//tr[@class="item"]'):

book = DoubanBookItem()

book['name'] = item.xpath('td[2]/div[1]/a/@title').extract()[0]

book['ratings'] = item.xpath('td[2]/div[2]/span[@class="rating_nums"]/text()').extract()[0]

# book['ratings'] = item.xpath('td[2]/div[2]/span[2]/text()').extract()[0]

book_info = item.xpath('td[2]/p[1]/text()').extract()[0]

book_info_contents = book_info.strip().split(' / ')

book['author'] = book_info_contents[0]

book['publisher'] = book_info_contents[1]

book['edition_year'] = book_info_contents[2]

book['price'] = book_info_contents[3]

yield book

错误：C:\anacoda\python.exe D:/scrapy/douban_book/douban_book/spiders/bookspider.py.py

Traceback (most recent call last):

File "D:/scrapy/douban_book/douban_book/spiders/bookspider.py.py", line 6, in

from douban_book.items import DoubanBookItem

ModuleNotFoundError: No module named 'douban_book'

这是怎么回事呀？谢谢

weixin_39705069

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。