python 存入数据库bigint_【Python】从0开始写爬虫——把扒到的豆瓣数据存储到数据库...

本文介绍了如何使用Python爬取豆瓣电影数据,并将其存储到MySQL数据库中,包括基本信息、主演和评价数据。通过创建不同的数据表,如电影信息表、主演表和评价数据表,并详细展示了数据插入的Python代码实现。
摘要由CSDN通过智能技术生成

1. 我们扒到了什么?

id, 名称, 上映年份,上映日期,所属类目, 导演,主演,片长,评分,星评,评价人数

2. 把这些数据做一个分类。

a..基本信息 :名称, 导演,上映年份, 所属类目, 片长

b.评价信息:评分,星评,评价人数

c.主演表: 主演(我在纠结要不要单独列一张表)

3 .表设计。现在有点蛋疼的是主键。用自增主键还是电影id做主键。经过我的多方面考虑,我慎重(草率)地决定,用电影id(反正都要建唯一索引,为什么不拿来当主键呢。。), 所以我刚才又在id那转了一下数据

m_id = re.search("[0-9]+", movie_url).group()

movie["id"] = int(m_id)

写着玩嘛,就是那么随意,有什么想法就改!!!

4. 建表。。也是蛋疼,我居然纠结过是用mysql还是mongodb, 马上就删自己一个耳光,你会mongodb嘛?感觉要是继续又开一个mongodb的坑,我就再也回不来这个爬虫了。

我也不傻不拉几地自己写建表sql了.直接用的SQLyog。稍微纠结了一下InnoDB和MyISAM。 我开始是想每次把一个电影的信息分别插入三个表,要不要用事务, 又想垃圾数据也不会扣我钱,所以用了MyISAM。毕竟就是大量的Insert和select

建表语句

CREATE DATABASE`douban`;USE`douban`;--基本信息表

CREATE TABLE`t_movie_info` (

`id`bigint(20) unsigned NOT NULL COMMENT '主键,豆瓣电影id',

`type`tinyint(4) DEFAULT NULL COMMENT '类型 0:电视剧,1:电影',

`name`varchar(30) DEFAULT NULL COMMENT '电影名字',

`director`varchar(50) DEFAULT NULL

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值