mysql连接池的实现

最新推荐文章于 2024-06-16 20:47:56 发布

BUG键盘侠

最新推荐文章于 2024-06-16 20:47:56 发布

阅读量261

点赞数

分类专栏：基础组件设计之池式组件文章标签： mysql 数据库 c++ 性能优化服务器

本文链接：https://blog.csdn.net/thunderlzm/article/details/126936582

版权

基础组件设计之池式组件专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

1、池化技术：简单点来说，就是提前保存大量的资源，以备不时之需

对于线程，内存，oracle的连接对象等等，这些都是资源，程序中当你创建一个线程或者在堆上申请一块内存时，都涉及到很多系统调用，也是非常消耗CPU的，如果你的程序需要很多类似的工作线程或者需要频繁的申请释放小块内存，如果没有在这方面进行优化，那很有可能这部分代码将会成为影响你整个程序性能的瓶颈。

2、特点：

对象创建时间长；
对象创建需要大量资源；
对象创建后可被重复使用

像常见的线程池、内存池、连接池、对象池都具有以上的共同特点。

3、重点内容：

为什么要使用连接池？
连接池的设计原理；
连接池扩展；
连接池连接数量和线程池数量的关系。

一、连接池

1、什么是数据库连接池？

1.1 定义：

数据库连接池（Connection pooling ）是程序启动时建立足够的数据库连接，并将这些连接组成，一个连接池，由程序动态地对池中的连接进行申请，使用，释放。

大白话：创建数据库连接是一个很耗时的操作，也容易对数据库造成安全隐患。所以，在程序初始化的时候，集中创建多个数据库连接，并把他们集中管理，供程序使用，可以保证较快的数据库读写速度，还更加安全可靠。这里讲的数据库，不单只是指Mysql ，也同样适用于 Redis 。

2、为什么使用数据库连接池？

资源复用：由于数据库连接得到复用，避免了频繁的创建、释放连接引起的性能开销，在减少系统消耗的基础上，另一方面也增进了系统运行环境的平稳性（减少内存碎片以及数据库临时进程/线程的量）。
更快的系统响应速度：数据库连接池在初始化过程中，往往已经创建了若干数据库连接置于池中备用。此时连接的初始化工作均已完成。对于业务请求处理而言，直接利用现有可用连接，避免了从数据库连接初始化和释放过程的开销，从而缩减了系统整体响应时间。
统一的连接管理，避免数据库连接泄露：在较为完备的数据库连接池实现中，可根据预先的连接占用超时设定，强制收回被占用连接。从而避免了常规数据库连接操作中可能出现的资源泄露。

2.1 不使用连接池

TCP建立连接的三次握手（客户端与MySQL服务器的连接基于TCP协议）
MySQL认证的三次握手
真正的SQL执行
MySQL的关闭
TCP的四次握手关闭

可以看到，为了执行一条 SQL ，需要进行 TCP 三次握手， Mysql 认证、 Mysql 关闭、 TCP 四次挥手等其他操作，执行SQL 操作在所有的操作占比非常低。

优点：实现简单

缺点：每一次发起 SQL 操作都经历 TCP 建立连接、数据库用户身份验证、数据库用户登出、 TCP 断开连接。

网络IO较多
带宽利用率低
QPS较低
应用频繁低创建连接和关闭连接，导致临时对象较多，带来更多的内存碎片
在关闭连接后，会出现大量TIME_WAIT 的TCP状态（在2个MSL之后关闭）

2.2 使用连接池

第一次访问的时候，需要建立连接。但是之后的访问，均会复用之前创建的连接，直接执行SQL语句。

优点：

降低了网络开销
连接复用，有效减少连接数。
提升性能，避免频繁的新建连接。新建连接的开销比较大
没有TIME_WAIT状态的问题

缺点： 设计较为复杂

2.3 长连接和连接池的区别

长连接是一些驱动、驱动框架、ORM工具的特性，由驱动来保持连接句柄的打开，以便后续的数据库操作可以重用连接，从而减少数据库的连接开销。
而连接池是应用服务器的组件，它可以通过参数来配置连接数、连接检测、连接的生命周期等。
连接池内的连接，其实就是长连接。

3 数据库连接池运行机制

从连接池获取或创建可用连接；
使用完毕之后，把连接返回给连接池；
在系统关闭前，断开所有连接并释放连接占用的系统资源；

4 连接池和线程池的关系

4.1 两者的区别

线程池：主动调用任务。当任务队列不为空的时候从队列取任务取执行。

连接池：被动被任务使用。当某任务需要操作数据库时，只要从连接池中取出一个连接对象，当任

务使用完该连接对象后，将该连接对象放回到连接池中。如果连接池中没有连接对象可以用，那么

该任务就必须等待。

4.2 连接池和线程池设置数量的关系

一般线程池线程数量和连接池连接对象数量一致；
一般线程执行任务完毕的时候归还连接对象；

5 线程池设计要点

使用连接池需要预先建立数据库连接。

线程池设计思路：

连接到数据库，涉及到数据库ip、端口、用户名、密码、数据库名字等；
- 连接的操作，每个连接对象都是独立的连接通道，它们是独立的
- 配置最小连接数和最大连接数
需要一个队列管理他的连接，比如使用list；
获取连接对象：
归还连接对象；
连接池的名字

5.1 连接池设计逻辑

5.1.1 构造函数：

CDBPool::CDBPool(const char *pool_name, const char *db_server_ip, uint16_t db_server_port,
const char *username, const char *password, const char *db_name, int max_conn_cnt)
{
    m_pool_name = pool_name;            //连接池名字
    m_db_server_ip = db_server_ip;      //mysql ip地址
    m_db_server_port = db_server_port;  //mysql端口
    m_username = username;              //mysql用户名
    m_password = password;              //mysql密码
    m_db_name = db_name;                //mysql数据库名字
    m_db_max_conn_cnt = max_conn_cnt;   //最大连接数 
    m_db_cur_conn_cnt = MIN_DB_CONN_CNT; // 最小连接数量
}

5.1.2 初始化：创建最小数量的连接，把连接插入到空闲队列

//创建最小数量的连接，把连接插入到空闲队列
int CDBPool::Init()
{
	// 创建固定最小的连接数量
	for (int i = 0; i < m_db_cur_conn_cnt; i++)
	{
		CDBConn *pDBConn = new CDBConn(this);
		int ret = pDBConn->Init();
		if (ret)
		{
			delete pDBConn;
			return ret;
		}
		m_free_list.push_back(pDBConn);
	}
	// log_info("db pool: %s, size: %d\n", m_pool_name.c_str(), (int)m_free_list.size());
	return 0;
}

5.1.3 请求获取连接

/*
 *TODO: 增加保护机制，把分配的连接加入另一个队列，这样获取连接时，如果没有空闲连接，
 *TODO: 检查已经分配的连接多久没有返回，如果超过一定时间，则自动收回连接，放在用户忘了调用释放连接的接口
 * timeout_ms默认为 0死等
 * timeout_ms >0 则为等待的时间
 */
int wait_cout = 0;
CDBConn *CDBPool::GetDBConn(const int timeout_ms)
{
	std::unique_lock<std::mutex> lock(m_mutex);
	if(m_abort_request) 
	{
		log_warn("have aboort\n");
		return NULL;
	}

	if (m_free_list.empty())		// 当没有连接可以用时
	{
		// 第一步先检测 当前连接数量是否达到最大的连接数量 
		if (m_db_cur_conn_cnt >= m_db_max_conn_cnt)
		{
			// 如果已经到达了，看看是否需要超时等待
			if(timeout_ms <= 0)		// 死等，直到有连接可以用 或者 连接池要退出
			{
				log_info("wait ms:%d\n", timeout_ms);
				m_cond_var.wait(lock, [this] 
				{
					// log_info("wait:%d, size:%d\n", wait_cout++, m_free_list.size());
					// 当前连接数量小于最大连接数量 或者请求释放连接池时退出
					return (!m_free_list.empty()) | m_abort_request;
				});
			} else {
				// return如果返回 false，继续wait(或者超时),  如果返回true退出wait
				// 1.m_free_list不为空
				// 2.超时退出
				// 3. m_abort_request被置为true，要释放整个连接池
				m_cond_var.wait_for(lock, std::chrono::milliseconds(timeout_ms), [this] {
					// log_info("wait_for:%d, size:%d\n", wait_cout++, m_free_list.size());
					return (!m_free_list.empty()) | m_abort_request;
				});
				// 带超时功能时还要判断是否为空
				if(m_free_list.empty()) 	// 如果连接池还是没有空闲则退出
				{
					return NULL;
				}
			}

			if(m_abort_request) 
			{
				log_warn("have aboort\n");
				return NULL;
			}
		}
		else // 还没有到最大连接则创建连接
		{
			CDBConn *pDBConn = new CDBConn(this);	//新建连接
			int ret = pDBConn->Init();
			if (ret)
			{
				log_error("Init DBConnecton failed\n\n");
				delete pDBConn;
				return NULL;
			}
			else
			{
				m_free_list.push_back(pDBConn);
				m_db_cur_conn_cnt++;
				// log_info("new db connection: %s, conn_cnt: %d\n", m_pool_name.c_str(), m_db_cur_conn_cnt);
			}
		}
	}

	CDBConn *pConn = m_free_list.front();	// 获取连接
	m_free_list.pop_front();	// STL 吐出连接，从空闲队列删除
	// pConn->setCurrentTime();  // 伪代码
	m_used_list.push_back(pConn);		// 

	return pConn;
}

5.1.4 归还连接

void CDBPool::RelDBConn(CDBConn *pConn)
{
	std::lock_guard<std::mutex> lock(m_mutex);

	list<CDBConn *>::iterator it = m_free_list.begin();
	for (; it != m_free_list.end(); it++)	// 避免重复归还
	{
		if (*it == pConn)	
		{
			break;
		}
	}

	if (it == m_free_list.end())
	{
		m_used_list.remove(pConn);
		m_free_list.push_back(pConn);
		m_cond_var.notify_one();		// 通知取队列
	} else 
	{
		log_error("RelDBConn failed\n");
	}
}

5.1.5 析构连接池

// 释放连接池
CDBPool::~CDBPool()
{
	std::lock_guard<std::mutex> lock(m_mutex);
	m_abort_request = true;
	m_cond_var.notify_all();		// 通知所有在等待的

	for (list<CDBConn *>::iterator it = m_free_list.begin(); it != m_free_list.end(); it++)
	{
		CDBConn *pConn = *it;
		delete pConn;
	}

	m_free_list.clear();
}

5.1.6 连接池名

5.2 mysql连接重连机制

5.2.1 设置启用（当发现连接断开时的）自动重连（在 初始化函数里面 ）

my_bool reconnect = true;

mysql_options(m_mysql, MYSQL_OPT_RECONNECT, &reconnect); // 配合 mysql_ping 实现自动重连

5.2.2. 检测连接是否正常

int STDCALL mysql_ping(MYSQL *mysql); //函数在 #include <mysql.h>

描述：检查与服务端的连接是否正常。连接断开时，如果自动重新连接功能未被禁用，则尝试重

新连接服务 器。该函数可被客户端用来检测闲置许久以后，与服务端的连接是否关闭，如有需要，则重新连接。

返回值：

连接正常，返回 0 ；如有错误发生，则返回非 0 值。返回非 0 值并不意味着服务器本身关闭掉，也有可能是网络原因导致网络不通。

5.2.3 redis 重连机制

使用之前检测连接是否可用
使用过程中出现连接异常则释放异常
下一次使用该连接的时候如果发现连接不可用则重新初始化

redis 的重连机制设计和 mysql 有区别

6 连接池的具体实现

6.1 mysql常见命令

对数据库不熟悉的朋友参考： MySQL 教程 | 菜鸟教程 (runoob.com)

CREATE DATABASE 数据库名; 创建数据库
USE 数据库名; 选择数据库
DROP DATABASE <数据库名>; 删除数据库
CREATE TABLE table_name (column_name column_type); 创建表
DROP TABLE table_name ; 删除表
SELECT column_name,column_name 查询
FROM table_name
[WHERE Clause]
[LIMIT N][ OFFSET M]

查询实例读取数据表：

select * from runoob_tbl;

6.2 redis常见命令

对 redis不熟悉的朋友参考： Redis 教程 | 菜鸟教程 (runoob.com)

6.3 连接池实现代码

自己新建一个数据库配合连接池使用案例：mysql_pool：

有道云笔记https://note.youdao.com/s/9Rv9b5Ea

redis(数据库)配合连接池使用案例：redis_poll:有道云笔记https://note.youdao.com/s/OESSKLhf

6.4 MySQL和Redis客户端连接编程

具体的 mysql 、 redis 客户端编程后续在 mysql 专题、 redis 专题里讲解。

mysql api c 客户端： https://www.yuque.com/linuxer/linux_senior/rcz4xl

hiredis 的使用： https://www.yuque.com/linuxer/linux_senior/ofs3au

6.5 案例

问：4个连接池对象和4个线程使用4个连接池做同样的事情吗？还是区分每个线程做不同的事情。

答：连接池只是提供了连接对象，提供了一条连接通道，至于调用者要拿这个连接对象做什么业务是用调用者取决定的。出于业务解耦合的场景，也可以设置不同的线程池和不同的连接池应对不同的业务， 如即时通讯写入聊天记录和读取聊天记录采用不同的线程池和对象池。

7、连接池连接设置数量

7.1 经验公式

连接数 = ((核心数 * 2) + 有效磁盘数)

按照这个公式，即是说你的服务器 CPU 是 4 核 i7 的，那连接池连接数大小应该为 ((4*2)+1)=9

这里只是一个经验公式。还要和线程池数量以及具体业务结合在一起。

CPU总核数 = 物理CPU个数 * 每颗物理CPU的核数

总逻辑CPU数 = 物理CPU个数 * 每颗物理CPU的核数 * 超线程数

查看 CPU 信息（型号）

[root@AAA ~]# cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c

4 Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz

# 查看物理 CPU 个数

[root@AAA ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

2

# 查看每个物理 CPU 中 core 的个数 ( 即核数 )

[root@AAA ~]# cat /proc/cpuinfo| grep "cpu cores"| uniq

cpu cores : 2

# 查看逻辑 CPU 的个数

[root@AAA ~]# cat /proc/cpuinfo| grep "processor"| wc -l

4

7.2 IO密集型的任务

如果任务整体上是一个IO密集型的任务。在处理一个请求的过程中，总共耗时100+5=105ms，而其中只有5ms是用于计算操作的，CPU利用率为5/(100+5)。使用线程池是为了尽量提高CPU的利用率，减少对CPU资源的浪费，假设以100%的CPU利用率来说，要达到100%的CPU利用率，对于一个CPU就要设置其利用率的倒数个数的线程数，也即1/(5/(100+5))=21，4个CPU的话就乘以4。那么算下来的话，就是……84，这个时候线程池要设置84个线程数，然后连接池也是设置为84个连接。