C++后端开发(3.1.4)——mysql连接池原理与实现
小节提纲
连接池性能的影响的2个因素,tcp连接和mysql认证
连接请求归还策略
连接超时归还策略
接断开重连策略
连接数量最优策略
1.简介
1.1 池化技术
池化技术能够减少资源对象的创建次数,提高程序的响应性能,特别是在高并发下这种提高更加明显。
使用池化技术缓存的资源对象有如下共同特点:
- 对象创建时间长;
- 对象创建需要大量资源;
- 对象创建后可被重复使用
像常见的线程池、内存池、连接池、对象池都具有以上的共同特点。
1.2 数据库连接池
定义:数据库连接池(Connection pooling)是程序启动时建立足够的数据库连接,并将这些连接组成一个连接池,由程序动态地对池中的连接进行申请,使用,释放。
大白话:创建数据库连接是一个很耗时的操作,也容易对数据库造成安全隐患。所以,在程序初始化的时候,集中创建多个数据库连接,并把他们集中管理,供程序使用,可以保证较快的数据库读写速度,还更加安全可靠。
这里讲的数据库,不单只是指Mysql,也同样适用于Redis
2 数据库连接池的使用分析
- 资源复用
由于数据库连接得到复用,避免了频繁的创建、释放连接引起的性能开销,在减少系统消耗的基础上,另一方面也增进了系统运行环境的平稳性(减少内存碎片以及数据库临时进程/线程的数
量)。 - 更快的系统响应速度
数据库连接池在初始化过程中,往往已经创建了若干数据库连接置于池中备用。此时连接的初始化工作均已完成。对于业务请求处理而言,直接利用现有可用连接,避免了从数据库连接初始化和释放过程的开销,从而缩减了系统整体响应时间。 - 统一的连接管理,避免数据库连接泄露
在较为完备的数据库连接池实现中,可根据预先的连接占用超时设定,强制收回被占用连接。从而避免了常规数据库连接操作中可能出现的资源泄露。
2.1 不使用连接池
2.1.1 连接过程
- TCP建立连接的三次握手(客户端与MySQL服务器的连接基于TCP协议)
- MySQL认证的三次握手
- 真正的SQL执行
- MySQL的关闭
- TCP的四次握手关闭
可以看到,为了执行一条SQL,需要进行TCP三次握手,Mysql认证、Mysql关闭、TCP四次挥手等其他
操作,执行SQL操作在所有的操作占比非常低
2.1.2 优缺点
- 优点:
实现简单 - 缺点:
1.网络IO较多
2.带宽利用率低
3.QPS较低
4.应用频繁低创建连接和关闭连接,导致临时对象较多,带来更多的内存碎片
5.在关闭连接后,会出现大量TIME_WAIT 的TCP状态(在2个MSL之后关闭)
2.2 使用连接池
2.2.1 连接过程
第一次访问的时候,需要建立连接。 但是之后的访问,均会复用之前创建的连接,直接执行SQL语句
2.2.2 优缺点
- 优点:
1.降低了网络开销
2.连接复用,有效减少连接数。
3.提升性能,避免频繁的新建连接。新建连接的开销比较大
4.没有TIME_WAIT状态的问题 - 缺点:
1.设计较为复杂
2.3 长连接和连接池的区别
- 长连接是一些驱动、驱动框架、ORM工具的特性,由驱动来保持连接句柄的打开,以便后续的数据库操作可以重用连接,从而减少数据库的连接开销。
- 而连接池是应用服务器的组件,它可以通过参数来配置连接数、连接检测、连接的生命周期等。
- 连接池内的连接,其实就是长连接
3 数据库连接池运行机制
从连接池获取或创建可用连接;
使用完毕之后,把连接返回给连接池;
在系统关闭前,断开所有连接并释放连接占用的系统资源;
3.1 连接池和线程池的关系
3.1.1 连接池和线程池的区别
- 线程池:主动调用任务。当任务队列不为空的时候从队列取任务取执行。
比如去银行办理业务,窗口柜员是线程,多个窗口组成了线程池,柜员从排号队列叫号执行。 - 连接池:被动被任务使用。当某任务需要操作数据库时,只要从连接池中取出一个连接对象,当任务使用完该连接对象后,将该连接对象放回到连接池中。如果连接池中没有连接对象可以用,那么该任务就必须等待。
比如去银行用笔填单,笔是连接对象,我们要用笔的时候去取,用完了还回去。
3.1.2 连接池和线程池设置数量的关系
- 一般线程池线程数量和连接池连接对象数量一致;
- 一般线程执行任务完毕的时候归还连接对象;
4 连接池设计
使用连接池需要预先建立数据库连接。
线程池设计思路:
- 连接到数据库,涉及到数据库ip、端口、用户名、密码、数据库名字等;
1). 连接的操作,每个连接对象都是独立的连接通道,它们是独立的
2). 配置最小连接数和最大连接数 - 需要一个队列管理他的连接,比如使用list;
- 获取连接对象:
- 归还连接对象;
- 连接池的名字
4.1 连接池设计逻辑
4.1.1 构造函数
4.1.2 初始化
4.1.3 请求获取连接
4.1.4 归还连接
4.1.5 析构函数
4.1.6 连接池名
4.2 mysql 连接重连机制
- 设置启用(当发现连接断开时的)自动重连
my_bool reconnect = true;
mysql_options(m_mysql, MYSQL_OPT_RECONNECT, &reconnect); // 配合mysql_ping实现自动重连
- 检测连接是否正常
int STDCALL mysql_ping(MYSQL *mysql);
- 描述:
检查与服务端的连接是否正常。连接断开时,如果自动重新连接功能未被禁用,则尝试重新连接服务器。该函数可被客户端用来检测闲置许久以后,与服务端的连接是否关闭,如有需要,则重新连接。 - 返回值:
连接正常,返回0;如有错误发生,则返回非0值。返回非0值并不意味着服务器本身关闭掉,也有可能是网络原因导致网络不通。
4.3 redis重连机制
- 使用之前检测连接是否可用
- 使用过程中出现连接异常则释放异常
- 下一次使用该连接的时候如果发现连接不可用则重新初始化
5 连接池具体实现
5.1 mysql常见命令
CREATE DATABASE 数据库名; 创建数据库
USE 数据库名; 选择数据库
DROP DATABASE <数据库名>; 删除数据库
CREATE TABLE table_name (column_name column_type); 创建表
DROP TABLE table_name ; 删除表
SELECT column_name,column_name 查询
FROM table_name
[WHERE Clause]
[LIMIT N][ OFFSET M]
查询实例读取数据表:
select * from runoob_tbl;
5.2 连接池实现代码
mysql_pool
#define DB_HOST_IP "127.0.0.1" // 数据库服务器ip
#define DB_HOST_PORT 3306
#define DB_DATABASE_NAME "mysql_pool_test" // 数据库对应的库名字, 这里需要自己提前用命
令创建完毕
#define DB_USERNAME "root" // 数据库用户名
#define DB_PASSWORD "123456" // 数据库密码
#define DB_POOL_NAME "mysql_pool" // 连接池的名字,便于将多个连接池集中管理
#define DB_POOL_MAX_CON 4 // 连接池支持的最大连接数量
redis_pool
#define DB_HOST_IP "127.0.0.1" // 数据库服务器ip
#define DB_HOST_PORT 6379
#define DB_INDEX 0 // redis默认支持16个db
#define DB_PASSWORD "" // 数据库密码,不设置AUTH时该参数为空
#define DB_POOL_NAME "redis_pool" // 连接池的名字,便于将多个连接池集中管理
#define DB_POOL_MAX_CON 4 // 连接池支持的最大连接数量
5.3 msyql_pool测试
- 编译
cd redis_pool
mdkir build
cmake ..
make
- 测试数据库的连接
- test_curd.cpp对应源码
- 修改主机的地址: #define DB_HOST_IP “127.0.0.1” // 数据库服务器ip以及其他的参数,比如端口、用户名、密码等
- 执行:./test_curd
- 本地:每个任务都重新创建连接
- test_dbpool.cpp 对应workNoPool函数的执行
- 修改主机的地址: #define DB_HOST_IP “127.0.0.1” // 数据库服务器ip以及其他的参数,比如端口、用户名、密码等
- 执行:./test_dbpool 4 4 0
- 本地:任务从连接池读取连接
- test_dbpool.cpp 对应workUsePool函数的执行
- 修改主机的地址: #define DB_HOST_IP “127.0.0.1” // 数据库服务器ip以及其他的参数,比如端口、用户名、密码等
- 执行:./test_dbpool 4 4 1
- 远程:每个任务都重新创建连接
- test_dbpool.cpp 对应workNoPool函数的执行
- 修改主机的地址: #define DB_HOST_IP “127.0.0.1” // 数据库服务器ip以及其他的参数,比如端口、用户名、密码等
- 执行:./test_dbpool 4 4 0
- 远程:任务从连接池读取连接
- test_dbpool.cpp 对应workNoPool函数的执行
- 修改主机的地址: #define DB_HOST_IP “114.215.169.66” // 数据库服务器ip以及其他的参数,比如端口、用户名、密码等
- 执行:./test_dbpool 4 4 1
编译后的执行文件在build目录
5.4 redis_pool测试
- 编译
cd redis_pool
mdkir build
cmake ..
make
编译后的执行文件在build目录
- 对应test_CachePoo.cpp
testCacheUsePool 函数 测试使用同一连接重复set数据
testCacheOneCmdPerConn函数测试 每次set都重新创建连接
- 对应test_dbpool.cpp
./test_dbpool 4 4 1 代表使用4线程,4连接,1使用连接池
./test_dbpool 4 4 0 代表使用4线程,4连接,0不用连接池
5.5 8 连接池连接设置数量
连接数 = ((核心数 * 2) + 有效磁盘数)
按照这个公式,即是说你的服务器 CPU 是 4核 i7 的,那连接池连接数大小应该为 ((4*2)+1)=9
这里只是一个经验公式。还要和线程池数量以及具体业务结合在一起。
CPU总核数 = 物理CPU个数 * 每颗物理CPU的核数
总逻辑CPU数 = 物理CPU个数 * 每颗物理CPU的核数 * 超线程数
查看CPU信息(型号)[root@AAA ~]# cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
4 Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz
# 查看物理CPU个数
[root@AAA ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
2 #
查看每个物理CPU中core的个数(即核数)
[root@AAA ~]# cat /proc/cpuinfo| grep "cpu cores"| uniq
cpu cores : 2
# 查看逻辑CPU的个数
[root@AAA ~]# cat /proc/cpuinfo| grep "processor"| wc -l
4