python简单爬虫:爬取并统计自己博客页面的信息(四)

本文介绍了一个使用Python编写的简单爬虫,它爬取并统计个人博客信息。涉及内容包括数据库模块(MySQL)、结果输出模块(CSV及MySQL存储)、crontab定时任务设置,以及展示的最终结果。代码已上传至GitHub。
摘要由CSDN通过智能技术生成

python简单爬虫:爬取并统计自己博客页面的信息(三)中介绍了html解析器的简单实现,接下来介绍mysql模块、结果输出模块,最后展示一下结果。

10. 数据库模块:mysql.py

因为结果输出模块中使用到了mysql,因此在讲结果输出模块之前,先讲mysql模块。

  • mysql是一个关系型数据库管理系统(DBMS),而数据库则是通过DBMS创建和操纵的容器。
  • 一个DBMS中可以有很多个数据库,每一个数据库中可以有很多表(tables)。表是一种结构化的文件,用来存储某种特定类型数据的结构化清单。简单理解,一个表可以看作是大家熟悉的excel文件中的一个sheet。
  • 为了方便,我在本地的mysql中手动创建了一个数据库,并在数据库中创建了一个用来存储我的csdn博客数据的表格(只有表头)
# 使用root用户登录数据库管理系统
:~$ mysql -uroot -plinux123
mysql> create database yvettre;     # 创建名为yvettre的数据库
mysql> use yvettre;                 # 使用yvettre数据库
mysql> create table if not exists csdn (datetime DATETIME, origin int, fans int, likey int, comment int, views int, score int, rank int, level int);                      # 创建名为csdn的表格
  • 在python中使用mysq
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值