连接MySQL数据库
常用连接方式:
from sqlalchemy import create_engine
engine=create_engine("mysql+pymysql://root:123456@localhost:3306/test?charset=utf8",echo=True)
create_engine,的参数设置说明如下:
- mysql+pymysql://root:123456@localhost:3306/test:mysql指明数据库系统类型,pymysql是连接数据库接口的模块,root是数据库系统用户名,123456是数据库系统的密码,localhost:3306是本地的数据库系统和数据库端口,test是数据库名称。
- echo=True:用于显示SQLAlchemy在操作数据库时所执行的SQL语句情况,相当于一个监视器,可以清楚知道执行情况,如果设置False,就可以关闭。
- pool_size:设置连接数,默认设置5个连接数,连接数可以根据实际情况进行调整,在一般的爬虫开发中,默认值已经足够
- max_overflow:默认连接数为10。当超出最大连接数后,如果超出的连接数在 max_overflow设置的访问内,超出的部分还可以继续连接访问,在使用过后,这部分连接不放在pool(连接池)中,而是被真正关闭。
- pool_recycle:连接重置周期,默认为-1,推荐设置为7200,即如果连接已空闲7200就自动重新获取,以防止connection被关闭。
- pool_timeout:连接超时时间,默认为30秒,超过时间的连接都会连接失败。
- ?charset=utf8:对数据库进行编码设置,能对数据库进行中文读写,如果不设置,在数据添加、修改和更新等时,就会提示编码错误。
from sqlalchemy import create_engine
engine=create_engine("mysql+pymysql://root:123456@localhost:3306/test?charset=utf8",echo=True,
pool_size=5,max_overflow=4,pool_recycle=7200,pool_tiemout=30)
使用SQLAlchemy创建数据表:
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import Column,Integer,String,DateTime
Base=declarative_base()
class mytable(Base):
# 表名
__tablename__='mytable'
# 字段,属性
id=Column(Integer,primary_key=True,autoincrement=True) #autoincrement=True 自增
name=Column(String(50),unique=True)
age=Column(Integer)
birth=Column(DateTime)
class_name=Column(String(50))
# 创建数据表
Base.metadata.create_all(engine)
引入 declarative_base模块,生成其对象Base,再创建一个类 mytable。一般情况下,数据表名和类名是一致的,__tablename_用于定义数据表的名称,可忽略,忽略时默认类名为数据表名。然后创建字段id、name、age、birth、class_name。primary_key=True:主键、autoincrement=True:自增。最后使用Base.metadata.create_all(engine)在数据库中创建对应的数据表。
类似SQL语句的创建方法:
from sqlalchemy import Column,MetaData,ForeignKey,Table
from sqlalchemy.dialects.mysql import (INTEGER,CHAR)
meta = MetaData()
myclass=Table('myclass',meta,
Column('id',INTEGER,primary_key=True),
Column('name',CHAR(50),ForeignKey(mytable.name)),
Column('class_name',CHAR(50))
)
#创建数据表
myclass.create(bind=engine)
此创建方法与前面介绍的创建数据表的方法大有不同,代码比较偏向于SQL创建数据表的语法,两者引入的模块也各不相同,导致在创建数据表的时候,创建语法也不一致。不过两者实现的功能是一样的,读者可以根据自己的爱好进行选择。一般情况下,前者较有优势,在数据表已经在在的情况下,前者再创建数据表不会报错,后者就会提示已存在数据表的错误信息。
若要删除数据表,则可用以下代码:
#先删除myclass,后删除mytable
myclass.drop(bind=engine)
Base.metadata.drop_all (engine)
在删除数据表时候,一定要先删除设有外键的数据表,也就是先删除myclass后才能删除mytable,两者之间涉及外键,这是在数据库中删除数据表的规则。
以下是完整代码:
from sqlalchemy import create_engine
engine=create_engine("mysql+pymysql://root:123456@localhost:3306/test?charset=utf8",echo=True)
# 创建数据表方法一
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import Column,Integer,String,DateTime
Base=declarative_base()
class mytable(Base):
# 表名
__tablename__='mytable'
# 字段,属性
id=Column(Integer,primary_key=True)
name=Column(String(50),unique=True)
age=Column(Integer)
birth=Column(DateTime)
class_name=Column(String(50))
# 创建数据表
Base.metadata.create_all(engine)
#创建数据表二:
# 类似sql语句的创建方法
from sqlalchemy import Column,MetaData,ForeignKey,Table
from sqlalchemy.dialects.mysql import (INTEGER,CHAR)
meta = MetaData()
myclass=Table('myclass',meta,
Column('id',INTEGER,primary_key=True),
Column('name',CHAR(50),ForeignKey(mytable.name)),
Column('class_name',CHAR(50)))
#创建数据表
myclass.create(bind=engine)
#先删除myclass,后删除mytable
myclass.drop(bind=engine)
Base.metadata.drop_all (engine)