个性化菜谱APP的实现(二) 菜谱数据保存

本文介绍了个性化菜谱APP中菜谱数据的保存过程,包括数据库表设计和数据下载。重点讲解了使用Selenium和Scrapy作为爬虫工具抓取数据,Selenium用于辅助动态数据获取,Scrapy则负责异步处理和数据存储。通过修改Scrapy的items.py、pipelines.py和配置文件实现数据保存到MySQL。
摘要由CSDN通过智能技术生成

一、数据库表设计

总结下网上各种菜谱的特点,选取必要的、共同的数据项。设计数据库表recipes的数据项如下:

    recipeid:编号,主键

    name:菜谱名称

    coverimage:封面图片

    categories:类别

    desc:简述

    ingredients:原料

    method:制作方法

    images:制作图片

    tips:提示

    stars:星级

    source:原地址

二、数据下载

表有了,下面就要解析页面,保存页面的数据到数据库中了。

最方便的工具是各种网络爬虫软件,两个常用的python开源工具如下:

1、Selenium:分布式的自动化测试工具,支持多平台:windows、linux、MAC ,支持多浏览器:ie、ff、safari、opera、chrome,多语言C、 java、ruby、python、C#

网址:https://github.com/SeleniumHQ/selenium

2、Scrapy:是一套基于Twisted的异步处理框架,纯Python实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常方便

网址:https://github.com/scrapy/scrapy

Selenium主要是用于测试的工具,直接爬取数据并不是它的主要支持内容,依据说明文档,属于Worst Practices。可以和Scrapy配合使用抓取动态数据。

Scrapy的架构使用起来很灵活,它的帮助文档地址是:https://docs.scrapy.org/en/latest/

架构图如下:

Scrapy architecture

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值