sqlalchemy mysql_python-使用SQLAlchemy to_sq使用熊猫写入MySQL数据库

最新推荐文章于 2024-09-13 07:04:42 发布

一块石头子

最新推荐文章于 2024-09-13 07:04:42 发布

阅读量524

点赞数

文章标签： sqlalchemy mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32002013/article/details/113542360

版权

本文展示了如何使用SQLAlchemy的create_engine创建MySQL数据库连接，并通过Pandas的to_sql方法将数据帧写入MySQL表。两种解决方案分别涉及直接使用create_engine和结合pymysql使用。

摘要由CSDN通过智能技术生成

python-使用SQLAlchemy to_sq使用熊猫写入MySQL数据库

尝试使用to_sql将pandas数据帧写入MySQL表。以前使用过flavor='mysql'，但是将来会贬值，希望开始过渡到使用SQLAlchemy引擎。

样例代码：

import pandas as pd

import mysql.connector

from sqlalchemy import create_engine

engine = create_engine('mysql+mysqlconnector://[user]:[pass]@[host]:[port]/[schema]', echo=False)

cnx = engine.raw_connection()

data = pd.read_sql('SELECT * FROM sample_table', cnx)

data.to_sql(name='sample_table2', con=cnx, if_exists = 'append', index=False)

读取工作正常，但to_sql出现错误：

DatabaseError：对sql'SELECT name from sqlite_master的执行失败 WHERE type ='table'AND name = ?;'：期间的参数数量错误字符串格式

为什么看起来要使用sqlite？ sqlalchemy与mysql特别是mysql.connector的正确使用是什么？

我也尝试将引擎作为连接传递，这给了我一个错误，该错误没有引用任何游标对象。

data.to_sql(name='sample_table2', con=engine, if_exists = 'append', index=False)

>>AttributeError: 'Engine' object has no attribute 'cursor'

5个解决方案

67 votes

使用引擎代替raw_connection()的工作原理是：

import pandas as pd

import mysql.connector

from sqlalchemy import create_engine

engine = create_engine('mysql+mysqlconnector://[user]:[pass]@[host]:[port]/[schema]', echo=False)

data.to_sql(name='sample_table2', con=engine, if_exists = 'append', index=False)

不清楚为什么我昨天尝试这样做时会给我更早的错误。

AsAP_Sherb answered 2020-07-07T12:22:25Z

8 votes

或者，使用pymysql封装...

import pymysql

from sqlalchemy import create_engine

cnx = create_engine('mysql+pymysql://[user]:[pass]@[host]:[port]/[schema]', echo=False)

data = pd.read_sql('SELECT * FROM sample_table', cnx)

data.to_sql(name='sample_table2', con=cnx, if_exists = 'append', index=False)

openwonk answered 2020-07-07T12:22:45Z

7 votes

使用pymysql和sqlalchemy，这适用于Pandas v0.22：

import pandas as pd

import pymysql

from sqlalchemy import create_engine

user = 'yourUserName'

passw = 'password'

host = 'hostName' # either localhost or ip e.g. '172.17.0.2' or hostname address

port = 3306

database = 'dataBaseName'

mydb = create_engine('mysql+pymysql://' + user + ':' + passw + '@' + host + ':' + str(port) + '/' + database , echo=False)

directory = r'directoryLocation' # path of csv file

csvFileName = 'something.csv'

df = pd.read_csv(os.path.join(directory, csvFileName ))

df.to_sql(name=csvFileName[:-4], con=mydb, if_exists = 'replace', index=False)

"""

if_exists: {'fail', 'replace', 'append'}, default 'fail'

fail: If table exists, do nothing.

replace: If table exists, drop it, recreate it, and insert data.

append: If table exists, insert data. Create if does not exist.

"""

DougR answered 2020-07-07T12:23:07Z

1 votes

我知道在问题的标题中包括单词SQLAlchemy，但是我在问题和答案中看到需要导入pymysql或mysql.connector，也可以使用pymysql来完成这项工作，而无需调用SQLAlchemy。

import pymysql

user = 'root'

passw = 'my-secret-pw-for-mysql-12ud' # In previous posts variable "pass"

host = '172.17.0.2'

port = 3306

database = 'sample_table' # In previous posts similar to "schema"

conn = pymysql.connect(host=host,

port=port,

user=user,

passwd=passw,

db=database)

data.to_sql(name=database, con=conn, if_exists = 'append', index=False, flavor = 'mysql')

我认为这种解决方案虽然不使用SQLAlchemy，但会很好。

Rafael Valero answered 2020-07-07T12:23:32Z

-1 votes

该问题的快速解决方案是在脚本中包含以下行：

pd.io.sql._SQLALCHEMY_INSTALLED = True

原因是因为to_sql会呼叫pandasSQL_builder，而本身会呼叫_is_sqlalchemy_connectable，后者会检查是否已安装sqlalchemy。但是由于某种原因，即使安装了sqlalchemy，该函数似乎也认为不是。我正在使用熊猫0.24.2。

pedrostrusso answered 2020-07-07T12:23:57Z

一块石头子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

一块石头子 CSDN认证博客专家 CSDN认证企业博客

码龄6年

67: 原创

-: 周排名

41万+: 总排名

12万+: 访问

: 等级

87: 积分

39: 粉丝

13: 获赞

1: 评论

66: 收藏

私信

关注

热门文章

最新评论

flask celery python 每月定时任务
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1)整个项目目录结构, 2）@task入参 ,3）celery的配置，4）celery的配置 include ,5）cmd命令行启动参数 --queues= 的值,6）用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。 pip install funboost

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。