数据库实战--影刀版

资源

中国历年票房链接: http://www.boxofficecn.com/boxofficecn

抓取数据

在这里插入图片描述

对脏数据进行处理

在这里插入图片描述

读取所有数据

在这里插入图片描述

插入代码段

import pandas as pd

# 假设 datatable 已经定义,并且包含数据
#datatable = [...]

# 创建 DataFrame,并使用第一行作为列名
df = pd.DataFrame(datatable, columns=datatable.pop(0))

# 提取 "票房(万元)" 列中的数字,并创建新的 "票房" 列
df["票房"] = df["票房(万元)"].str.extract(r"^(\d+(\.\d+)?)")[0]

# 删除包含 NaN 值的行
df = df[df["票房"].notna()]

# 删除 "序列" 和 "票房(万元)" 列
df = df.drop(columns=["序列", "票房(万元)"])

# 将 DataFrame 转换为列表的列表
datatable = df.values.tolist()

执行sql语句

CREATE TABLE boxoffice(
    -- 年份字段,存储电影的发行年份
    year int,
    
    -- 电影名称字段,存储电影名称,最大长度255个字符
    movie_name varchar(255),
    
    -- 票房字段,存储电影的票房收入,使用浮点数表示
    box_office float
);

批量插入到数据库

在这里插入图片描述

结果

在这里插入图片描述

使用官方指令

其中odbc的配置要注意为32位的
参考文献: http://t.csdnimg.cn/1B72c

在这里插入图片描述
在这里插入图片描述

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值