scrapy爬虫框架将数据保存Mysql数据库中

最新推荐文章于 2024-08-05 20:06:05 发布

莫失莫忘Lawlite

最新推荐文章于 2024-08-05 20:06:05 发布

阅读量4.1w

点赞数 14

分类专栏：原创 GitHub 爬虫 mysql Python 文章标签：数据库 mysql 框架爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013082989/article/details/52589791

版权

scrapy爬虫框架简单Demo

github地址：https://github.com/lawlite19/PythonCrawler-Scrapy-Mysql-File-Template
使用scrapy爬虫框架将数据保存Mysql数据库和文件中

settings.py

修改Mysql的配置信息

#Mysql数据库的配置信息
MYSQL_HOST = '127.0.0.1'
MYSQL_DBNAME = 'testdb'         #数据库名字，请修改
MYSQL_USER = 'root'             #数据库账号，请修改 
MYSQL_PASSWD = '123456'         #数据库密码，请修改

MYSQL_PORT = 3306               #数据库端口，在dbhelper中使用

指定pipelines

ITEM_PIPELINES = {
    'webCrawler_scrapy.pipelines.WebcrawlerScrapyPipeline': 300,#保存到mysql数据库
    'webCrawler_scrapy.pipelines.JsonWithEncodingPipeline': 300,#保存到文件中
}

items.py

声明需要格式化处理的字段

class WebcrawlerScrapyItem(scrapy.Item):
    '''定义需要格式化的内容（或是需要保存到数据库的字段）'''
    # define the fields for your item here like:
    # name = scrapy.Field()
    name = scrapy.Field()   #修改你所需要的字段
    url = scrapy.Field()

pipelines.py

一、保存到数据库的类`WebcrawlerScrapyPipeline`（在settings中声明）

定义一个类方法from_settings，得到settings中的Mysql数据库配置信息，得到数据库连接池dbpool

    @classmethod
    def from_settings(cls,settings):

最低0.47元/天解锁文章

莫失莫忘Lawlite

关注

14
点赞
踩
75

收藏

觉得还不错? 一键收藏
13
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

莫失莫忘Lawlite CSDN认证博客专家 CSDN认证企业博客

码龄11年

91: 原创

38万+: 周排名

211万+: 总排名

78万+: 访问

: 等级

5812: 积分

508: 粉丝

402: 获赞

164: 评论

1087: 收藏

私信

关注

热门文章

分类专栏

系统 4篇
Asp.Net 11篇
SqlSerevr 6篇
原创 42篇
JS 1篇
JavaEE 19篇
阿里云服务器 9篇
Android 1篇
Linux 7篇
GitHub 22篇
算法 4篇
PowerDesigner 1篇
软件安装 9篇
mysql 1篇
爬虫 4篇
git 1篇
Python 12篇
机器学习 6篇
c-c++ 1篇
shell
深度学习 15篇
TensorFlow 7篇
论文记录 5篇
Cuda 2篇
Torch 1篇
GPU 2篇

最新评论

Triplet-Loss原理及其实现、应用
陈嘿萌: 这个就是对比损失吗？三元组损失。
Triplet-Loss原理及其实现、应用
Nikola007: 我想问一下，请问这个论文FaceNet: A Unified Embedding for Face Recognition and Clustering中的Triplet loss与另一篇Deep Metric Learning Using Triplet Network的Triplet Network有什么主要区别。
Triplet-Loss原理及其实现、应用
qq_33013891: 大佬有三个疑问，（1）1.1中mask怎么来的；（2）1.2中i!=j!=k和i=j,i!=k两个约束是不兼容的呀，为啥取and而不是or，前者已经规定i!=j了，后者又要i=j两个条件互斥如何求并；（3）如果i,j,k分别代表第1，2，3维度的话，那i_not_equal_j和i_not_equal_k取and得出来的是i!=j,i=k
Triplet-Loss原理及其实现、应用
qq_33013891: 大佬有三个疑问，（1）1.1中mask怎么来的；（2）1.2中i!=j!=k和i=j,i!=k两个约束是不兼容的呀，为啥取and而不是or，前者已经规定i!=j了，后者又要i=j两个条件互斥如何求并；（3）如果i,j,k分别代表第1，2，3维度的话，那i_not_equal_j和i_not_equal_k取and得出来的是i!=j,i=k
Triplet-Loss原理及其实现、应用
qq_33013891: 大佬有三个疑问，（1）1.1中mask怎么来的；（2）1.2中i!=j!=k和i=j,i!=k两个约束是不兼容的呀，为啥取and而不是or，前者已经规定i!=j了，后者又要i=j两个条件互斥如何求并；（3）如果i,j,k分别代表第1，2，3维度的话，那i_not_equal_j和i_not_equal_k取and得出来的是i!=j,i=k

最新文章

目录

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。