爬虫操作第三节-保存数据

本文记录了一位开发者在使用SQLite数据库保存数据时遇到的问题,包括numeric类型转换为字符串、SQL语句构造及正则表达式去除空格等挑战。最终成功将数据导入,但发现数据中存在NBSP问题。总结了数据库操作的关键点和调试经验。
摘要由CSDN通过智能技术生成

我们需要将数据保存到SQLite中,但是问题是我们保存的数据中含有numeric类型,但是拼接字符串的这个过程只允许说全部都是字符串的形式才能拼接.


def init_db(dbpath):
    sql = '''
        create table movie250
        (
        id INTEGER primary key autoincrement,
        info_link text,
        pic_link text,
        cname varchar,
        ename varchar,
        introduction text,
        score text ,
        info text,
        judge text          
        )
    '''
    #integer 表示说整数,整数是numeric的一部分
    conn = sqlite3.connect(dbpath)
    cursor=conn.cursor()
    cursor.execute(sql)
    conn.commit()
    conn.close()

def save_data_db(datalist, dbpath):
    init_db(dbpath)
    conn=sqlite3.connect(dbpath)
    cur=conn.cursor()

    for data in datalist:
        print('data:')
        print(data)

        for index in range(0,len(data)):
            # print('index:')
            # print(index)
            data[index]='"'+str(data[index])+'"'
            print('data[index]:'+data[index])
        print(",".join(data))
        sql='''
            insert into movie250(info_link,pic_link,cname,ename,introduction,score,info,judge) 
            values(%s)'''% ",".join(data)
        print(sql)
        cur.execute(sql)
        conn.commit()
    cur.close()
    conn.close()

注意

1)创造数据库时我们需要将建立的元素和后面插入到数据库的元素都是一一对应的

2)报错:

然后我试着将日志打印出的SQL语句放入到数据console中,发现问题所在:

3)我们想要去除ename和简介inq中的空格和'\',前者使用正则表达式,报错..

终于,在经历了一个下午的秃头的DEBUG,我终于把这个数据基本导入了数据库中,但是还算是有一些瑕疵

那就是数据中的etitle属性和info属性中间总是有NBSP/NBSP,而且只是通过str的操作竟让也不能改变,总之就很离谱,折腾来折腾去,暂时还是没有改变,看来到时候只能问老师了....

以下贴出源码:


def init_db(dbpath):
    sql1='''
        drop table movie250;
    '''
    sql2 = '''
        create table movie250
        (
        id INTEGER primary key autoincrement,
        info_link text,
        pic_link text,
        cname varchar,
        ename varchar,
        introduction text,
        score text ,
        info text,
        judge text          
        )
    '''
    #integer 表示说整数,整数是numeric的一部分
    conn = sqlite3.connect(dbpath)
    cursor=conn.cursor()
    cursor.execute(sql1)
    cursor.execute(sql2)
    conn.commit()
    conn.close()



def save_data_db(datalist, dbpath):
    init_db(dbpath)
    conn=sqlite3.connect(dbpath)
    cur=conn.cursor()

    for data in datalist:
        print('data:')
        print(data)

        for index in range(0,len(data)):
            # print('index:')
            # print(index)
            data[index]='"'+str(data[index])+'"'
            print('data[index]:'+data[index])
        sql='''
            insert into movie250(info_link,pic_link,cname,ename,introduction,score,info,judge) 
            values(%s)'''% ','.join(data)
        print(sql)
        cur.execute(sql)
    conn.commit()
    cur.close()
    conn.close()

 尤其注意:

1)我们在保存数据save_data这个函数中,拼接字符串时要注意插入的数据和建立的表格一一对应

2)数据既然选择使用双引号进行拼接,就需要将数据类型全部设置成为SQLite中的text或者varchar类型,不然编译器报错说期待str类型,但是其实是int类型

未完待续....

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Shallow_Carl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值