pd.to_sql()使用方法

最新推荐文章于 2024-08-03 15:52:30 发布

data-life

最新推荐文章于 2024-08-03 15:52:30 发布

阅读量5.1k

点赞数 1

分类专栏： Python 数据分析

原文链接：https://blog.csdn.net/The_Time_Runner/article/details/86602096

版权

Python 同时被 2 个专栏收录

97 篇文章 4 订阅

订阅专栏

数据分析

3 篇文章 0 订阅

订阅专栏

to_sql 使用方法：

参见pandas.to_sql函数，主要有以下几个参数：

    name: 输出的表名
    con: 与read_sql中相同，数据库链接
    if_exits：三个模式：fail，若表存在，则不输出；replace：若表存在，覆盖原来表里的数据；append：若表存在，将数据写到原表的后面。默认为fail
    index：是否将df的index单独写到一列中
    index_label:指定列作为df的index输出，此时index为True
    chunksize：同read_sql
    dtype: 指定列的输出到数据库中的数据类型。字典形式储存：{column_name: sql_dtype}。常见的数据类型有sqlalchemy.types.INTEGER(), sqlalchemy.types.NVARCHAR(),sqlalchemy.Datetime()等，具体数据类型可以参考这里
    还是以写到mysql数据库为例：

df.to_sql(name='table',
          con=con,
          if_exists='append',
          index=False,
          dtype={'col1':sqlalchemy.types.INTEGER(),
                 'col2':sqlalchemy.types.NVARCHAR(length=255),
                 'col_time':sqlalchemy.DateTime(),
                 'col_bool':sqlalchemy.types.Boolean
          })

**注：**如果不提供dtype,to_sql会自动根据df列的dtype选择默认的数据类型输出，比如字符型会以sqlalchemy.types.TEXT类型输出，相比NVARCHAR，TEXT类型的数据所占的空间更大，所以一般会指定输出为NVARCHAR；而如果df的列的类型为np.int64时，将会导致无法识别并转换成INTEGER型，需要事先转换成int类型（用map，apply函数可以方便的转换）。

注意：一定要记得提供一dtype类型，不然批量插入的速度会很慢。

具体dtype参考：https://docs.sqlalchemy.org/en/13/core/type_basics.html#sql-standard-and-multiple-vendor-types

参考

Arkenstone

..
2019-01-22 21:44:45写于邹平
————————————————
版权声明：本文为CSDN博主「quantLearner」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/The_Time_Runner/article/details/86602096