利用Scrapy框架爬取博客信息并存到mysql数据库

最新推荐文章于 2022-07-06 19:21:58 发布

VIP文章三名狂客

最新推荐文章于 2022-07-06 19:21:58 发布

阅读量924

点赞数

分类专栏： python爬虫文章标签： mysql 框架博客 python爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zuochao_2013/article/details/76512776

版权

一、所需要的库

(1)Scrapy

(2)pymysql

二、创建数据库和表

Create database hexun;
     Use hexun;
Create table myhexun(id int(10) auto_increment primary key not null,name varchar(30),url varchar(100),hits int(15),comment int(15));

三、创建Scrapy项目

(1)创建Scrapy项目:    scrapy startproject hexunpjt 
(2)创建spider爬虫:    scrapy  genspider -t basic Myhexunspd hexun.com
(3)开始爬取:          scrapy crawl myhexunspd
               或者   scrapy crawl myhexunspd --nolog

四、 items编写

import scrapy


class HexunpjtItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
#建立name存储文章名
    name= scrapy.Field()
#建立url存储文章url网址
    url= scrapy.Field()
#建立hits存储文章阅读数
    hits= scrapy.Field()
#建立comment存储文章评论数
    comment= scrapy.Field()

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
利用Scrapy框架爬取博客信息并存到mysql数据库

一、所需要的库 (1)Scrapy (2)pymysql二、创建数据库和表 Create database hexun; Use hexun;Create table myhexun(id int(10) auto_increment primary key not null,name varchar(30),url
复制链接

扫一扫

专栏目录

三名狂客 CSDN认证博客专家 CSDN认证企业博客

码龄11年

353: 原创

2万+: 周排名

132万+: 总排名

307万+: 访问

: 等级

2万+: 积分

1552: 粉丝

1212: 获赞

329: 评论

4600: 收藏

私信

关注

热门文章

分类专栏

最新评论

学术期刊划分(教你认识SCI、EI、SSCI、IEEE、CSSCI...)
码农的篮球与鸡: 多谢科普，受教了
禁忌搜索算法(Tabu Search)
Harmony_zheng: 我理解有问题，禁忌表是记录城市的全局变量，A是记录位置变化的，会随着迭代重置，所以我之前理解岔了
禁忌搜索算法(Tabu Search)
Harmony_zheng: 我写了一段全随机的过程，禁忌表在TSP问题中确实很有用，但是有点依赖初始解，需要多跑几遍
禁忌搜索算法(Tabu Search)
Harmony_zheng: 我又看了下，如果初始解比较好的话，随机过程不是很明显，禁忌表起到的效果也比较好，如果初始解不好，那随机过程会很明显，禁忌表的效果就会变得不那么重要，应该缩短禁忌表
禁忌搜索算法(Tabu Search)
Harmony_zheng: 我跑了好多次代码，跑出来的结果每次都不一样，更加证明了这是一个随机过程，只是把随机解算出的值进行了比较，禁忌搜索算法的作用没有体现出来

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。