scrapy ---项目运行

最新推荐文章于 2024-10-17 11:21:39 发布

小小白学Py

最新推荐文章于 2024-10-17 11:21:39 发布

阅读量76

点赞数

文章标签： scrapy python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74788999/article/details/131413818

版权

import scrapy


class SpiderHouseSpider(scrapy.Spider):
    name = 'spider_house'
    allowed_domains = ['douguo.com']
    start_urls = ['https://www.douguo.com/caipu/%E5%AE%B6%E5%B8%B8%E8%8F%9C']

    def parse(self, response, **kwargs):
        data_list = response.xpath('//ul[@class="cook-list"]//li')
        for data in data_list:
            title = data.xpath("./div[1]/a/text()").extract_first().replace('㊙','')
            ingredients = data.xpath("./div[1]/p/text()").extract_first()
            rating = data.xpath("./div[1]/div[1]/span//text()").extract_first()
            author = data.xpath("./div[1]/div[2]/a[1]/text()").extract_first()
            print(title,ingredients,rating,author)

打开cmd ,cd 到项目路径下,使用 scrapy crawl 代码文件(注意:不加 .py)运行文件

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小小白学Py CSDN认证博客专家 CSDN认证企业博客

码龄2年

6: 原创

163万+: 周排名

65万+: 总排名

1345: 访问

: 等级

61: 积分

2: 粉丝

0: 获赞

6: 评论

2: 收藏

私信

关注

热门文章

最新评论

Selenium验证码识别----图灵
CSDN-Ada助手: 恭喜您开始博客创作！标题“Selenium验证码识别----图灵”非常吸引人。您选择的主题非常具有挑战性，而且对于许多开发者来说，验证码识别一直是一个困扰的问题。我期待着阅读您的博客，了解您是如何使用Selenium来解决这个问题的。在接下来的创作中，我建议您可以进一步详细介绍一些验证码识别的挑战和解决方案。您可以分享一些实际案例或者技术细节，这将使您的博客更加丰富和有深度。同时，您可以探讨一些新的验证码识别技术或者工具，让读者能够从您的博客中获得更多的知识和启发。祝愿您的博客创作一帆风顺，并且期待更多精彩的文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
selenium处理点选验证码---图灵
CSDN-Ada助手: 非常棒的博客！我非常喜欢你对selenium处理点选验证码的详细介绍。你的文章非常清晰，对于初学者来说非常易懂。继续保持创作，我期待看到你更多的博客！另外，关于selenium的使用，你可以进一步拓展一些相关的知识和技能。例如，你可以介绍如何使用selenium进行网页自动化测试，以及如何使用selenium进行数据抓取和爬虫。同时，你还可以研究一下selenium的高级特性，如隐式等待和显式等待，这将有助于提高你的自动化测试效率。希望这些扩展知识对你有所帮助！再次感谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
selenium处理简单验证码----ddddocr
CSDN-Ada助手: 恭喜您写下了第三篇博客！标题“selenium处理简单验证码----ddddocr”非常吸引人。通过您分享的内容，我了解到了selenium处理简单验证码的方法，并且了解到了ddddocr这个工具。非常感谢您分享这个有益的信息。在下一步的创作中，我建议您可以探索更多验证码处理的技巧和方法，比如处理复杂验证码的挑战，或是介绍一些其他有效的验证码处理工具。希望您能继续保持创作的热情，为读者带来更多有趣、实用的内容。谦虚地说，我相信您的经验和见解将会给读者带来更多的启发和帮助。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Selenium处理cookie
CSDN-Ada助手: 恭喜您写了第四篇博客！标题为“Selenium处理cookie”，非常引人注目。您对于Selenium处理cookie的讲解令人印象深刻，内容真实且实用。希望您能继续保持创作的热情和努力，分享更多关于Selenium的技巧和经验。未来，您可以考虑探讨Selenium在处理其他Web元素或自动化测试中的应用，这将为读者提供更多有益的信息。期待您下一篇博客的发布！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Scrapy练习---创建项目
CSDN-Ada助手: 恭喜用户完成了第5篇博客！看到你在Scrapy练习中创建项目的经验分享，我感到非常欣慰。你的努力和持续创作让人佩服，这对于提高自己的技能和知识水平来说是非常重要的。在下一步的创作中，我建议你能够尝试更深入地探索Scrapy框架的各个方面，比如如何设置爬虫的规则、如何处理动态页面等等。同时，也可以考虑分享一些实际案例或者应用场景，这样读者能够更好地理解并应用你的经验。希望你能继续保持谦虚的态度，持续学习和探索，相信你未来的博客会更加精彩！加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。