前言
1、池化技术 :简单点来说,就是提前保存大量的资源,以备不时之需
对于线程,内存,oracle的连接对象等等,这些都是资源,程序中当你创建一个线程或者在堆上申请一块内存时,都涉及到很多系统调用,也是非常消耗CPU的,如果你的程序需要很多类似的工作线程或者需要频繁的申请释放小块内存,如果没有在这方面进行优化,那很有可能这部分代码将会成为影响你整个程序性能的瓶颈。
2、特点:
- 对象创建时间长;
- 对象创建需要大量资源;
- 对象创建后可被重复使用
像常见的线程池、内存池、连接池、对象池都具有以上的共同特点。
3、重点内容:
- 为什么要使用连接池?
- 连接池的设计原理;
- 连接池扩展;
- 连接池连接数量和线程池数量的关系。
一、连接池
1、 什么是数据库连接池?
1.1 定义:
2、为什么使用数据库连接池?
- 资源复用:由于数据库连接得到复用,避免了频繁的创建、释放连接引起的性能开销,在减少系统消耗的基础上,另一方面也增进了系统运行环境的平稳性(减少内存碎片以及数据库临时进程/线程的量)。
- 更快的系统响应速度:数据库连接池在初始化过程中,往往已经创建了若干数据库连接置于池中备用。此时连接的初始化 工作均已完成。对于业务请求处理而言,直接利用现有可用连接,避免了从数据库连接初始化和释放过程的开销,从而缩减了系统整体响应时间。
- 统一的连接管理,避免数据库连接泄露:在较为完备的数据库连接池实现中,可根据预先的连接占用超时设定,强制收回被占用连接。从而避免了常规数据库连接操作中可能出现的资源泄露。
2.1 不使用连接池
- TCP建立连接的三次握手(客户端与MySQL服务器的连接基于TCP协议)
- MySQL认证的三次握手
- 真正的SQL执行
- MySQL的关闭
- TCP的四次握手关闭
- 网络IO较多
- 带宽利用率低
- QPS较低
- 应用频繁低创建连接和关闭连接,导致临时对象较多,带来更多的内存碎片
- 在关闭连接后,会出现大量TIME_WAIT 的TCP状态(在2个MSL之后关闭)
2.2 使用连接池
第一次访问的时候,需要建立连接。 但是之后的访问,均会复用之前创建的连接,直接执行SQL语句。
优点:
- 降低了网络开销
- 连接复用,有效减少连接数。
- 提升性能,避免频繁的新建连接。新建连接的开销比较大
- 没有TIME_WAIT状态的问题
缺点: 设计较为复杂
2.3 长连接和连接池的区别
- 长连接是一些驱动、驱动框架、ORM工具的特性,由驱动来保持连接句柄的打开,以便后续的数据库操作可以重用连接,从而减少数据库的连接开销。
- 而连接池是应用服务器的组件,它可以通过参数来配置连接数、连接检测、连接的生命周期等。
- 连接池内的连接,其实就是长连接。
3 数据库连接池运行机制
- 从连接池获取或创建可用连接;
- 使用完毕之后,把连接返回给连接池;
- 在系统关闭前,断开所有连接并释放连接占用的系统资源;
4 连接池和线程池的关系
4.1 两者的区别
4.2 连接池和线程池设置数量的关系
- 一般线程池线程数量和连接池连接对象数量一致;
- 一般线程执行任务完毕的时候归还连接对象;
5 线程池设计要点
- 连接到数据库,涉及到数据库ip、端口、用户名、密码、数据库名字等;
- 连接的操作,每个连接对象都是独立的连接通道,它们是独立的
- 配置最小连接数和最大连接数
- 需要一个队列管理他的连接,比如使用list;
- 获取连接对象:
- 归还连接对象;
- 连接池的名字
5.1 连接池设计逻辑
5.1.1 构造函数:
CDBPool::CDBPool(const char *pool_name, const char *db_server_ip, uint16_t db_server_port,
const char *username, const char *password, const char *db_name, int max_conn_cnt)
{
m_pool_name = pool_name; //连接池名字
m_db_server_ip = db_server_ip; //mysql ip地址
m_db_server_port = db_server_port; //mysql端口
m_username = username; //mysql用户名
m_password = password; //mysql密码
m_db_name = db_name; //mysql数据库名字
m_db_max_conn_cnt = max_conn_cnt; //最大连接数
m_db_cur_conn_cnt = MIN_DB_CONN_CNT; // 最小连接数量
}
5.1.2 初始化:创建最小数量的连接,把连接插入到空闲队列
//创建最小数量的连接,把连接插入到空闲队列
int CDBPool::Init()
{
// 创建固定最小的连接数量
for (int i = 0; i < m_db_cur_conn_cnt; i++)
{
CDBConn *pDBConn = new CDBConn(this);
int ret = pDBConn->Init();
if (ret)
{
delete pDBConn;
return ret;
}
m_free_list.push_back(pDBConn);
}
// log_info("db pool: %s, size: %d\n", m_pool_name.c_str(), (int)m_free_list.size());
return 0;
}
5.1.3 请求获取连接
/*
*TODO: 增加保护机制,把分配的连接加入另一个队列,这样获取连接时,如果没有空闲连接,
*TODO: 检查已经分配的连接多久没有返回,如果超过一定时间,则自动收回连接,放在用户忘了调用释放连接的接口
* timeout_ms默认为 0死等
* timeout_ms >0 则为等待的时间
*/
int wait_cout = 0;
CDBConn *CDBPool::GetDBConn(const int timeout_ms)
{
std::unique_lock<std::mutex> lock(m_mutex);
if(m_abort_request)
{
log_warn("have aboort\n");
return NULL;
}
if (m_free_list.empty()) // 当没有连接可以用时
{
// 第一步先检测 当前连接数量是否达到最大的连接数量
if (m_db_cur_conn_cnt >= m_db_max_conn_cnt)
{
// 如果已经到达了,看看是否需要超时等待
if(timeout_ms <= 0) // 死等,直到有连接可以用 或者 连接池要退出
{
log_info("wait ms:%d\n", timeout_ms);
m_cond_var.wait(lock, [this]
{
// log_info("wait:%d, size:%d\n", wait_cout++, m_free_list.size());
// 当前连接数量小于最大连接数量 或者请求释放连接池时退出
return (!m_free_list.empty()) | m_abort_request;
});
} else {
// return如果返回 false,继续wait(或者超时), 如果返回true退出wait
// 1.m_free_list不为空
// 2.超时退出
// 3. m_abort_request被置为true,要释放整个连接池
m_cond_var.wait_for(lock, std::chrono::milliseconds(timeout_ms), [this] {
// log_info("wait_for:%d, size:%d\n", wait_cout++, m_free_list.size());
return (!m_free_list.empty()) | m_abort_request;
});
// 带超时功能时还要判断是否为空
if(m_free_list.empty()) // 如果连接池还是没有空闲则退出
{
return NULL;
}
}
if(m_abort_request)
{
log_warn("have aboort\n");
return NULL;
}
}
else // 还没有到最大连接则创建连接
{
CDBConn *pDBConn = new CDBConn(this); //新建连接
int ret = pDBConn->Init();
if (ret)
{
log_error("Init DBConnecton failed\n\n");
delete pDBConn;
return NULL;
}
else
{
m_free_list.push_back(pDBConn);
m_db_cur_conn_cnt++;
// log_info("new db connection: %s, conn_cnt: %d\n", m_pool_name.c_str(), m_db_cur_conn_cnt);
}
}
}
CDBConn *pConn = m_free_list.front(); // 获取连接
m_free_list.pop_front(); // STL 吐出连接,从空闲队列删除
// pConn->setCurrentTime(); // 伪代码
m_used_list.push_back(pConn); //
return pConn;
}
5.1.4 归还连接
void CDBPool::RelDBConn(CDBConn *pConn)
{
std::lock_guard<std::mutex> lock(m_mutex);
list<CDBConn *>::iterator it = m_free_list.begin();
for (; it != m_free_list.end(); it++) // 避免重复归还
{
if (*it == pConn)
{
break;
}
}
if (it == m_free_list.end())
{
m_used_list.remove(pConn);
m_free_list.push_back(pConn);
m_cond_var.notify_one(); // 通知取队列
} else
{
log_error("RelDBConn failed\n");
}
}
// 释放连接池
CDBPool::~CDBPool()
{
std::lock_guard<std::mutex> lock(m_mutex);
m_abort_request = true;
m_cond_var.notify_all(); // 通知所有在等待的
for (list<CDBConn *>::iterator it = m_free_list.begin(); it != m_free_list.end(); it++)
{
CDBConn *pConn = *it;
delete pConn;
}
m_free_list.clear();
}
5.2 mysql连接重连机制
- 使用之前检测连接是否可用
- 使用过程中出现连接异常则释放异常
- 下一次使用该连接的时候如果发现连接不可用则重新初始化
6 连接池的具体实现
6.1 mysql常见命令
- CREATE DATABASE 数据库名; 创建数据库
- USE 数据库名; 选择数据库
- DROP DATABASE <数据库名>; 删除数据库
- CREATE TABLE table_name (column_name column_type); 创建表
- DROP TABLE table_name ; 删除表
- SELECT column_name,column_name 查询
- FROM table_name
- [WHERE Clause]
- [LIMIT N][ OFFSET M]
6.2 redis常见命令
6.3 连接池实现代码
自己新建一个数据库配合连接池使用案例:mysql_pool:
有道云笔记https://note.youdao.com/s/9Rv9b5Ea
redis(数据库)配合连接池使用案例:redis_poll:有道云笔记https://note.youdao.com/s/OESSKLhf
6.4 MySQL和Redis客户端连接编程
6.5 案例
问:4个连接池对象和4个线程使用4个连接池做同样的事情吗?还是区分每个线程做不同的事情。
7、连接池连接设置数量
7.1 经验公式
查看 CPU 信息(型号)[root@AAA ~]# cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c4 Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz# 查看物理 CPU 个数[root@AAA ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l2# 查看每个物理 CPU 中 core 的个数 ( 即核数 )[root@AAA ~]# cat /proc/cpuinfo| grep "cpu cores"| uniqcpu cores : 2# 查看逻辑 CPU 的个数[root@AAA ~]# cat /proc/cpuinfo| grep "processor"| wc -l4
7.2 IO密集型的任务
如果任务整体上是一个IO密集型的任务。在处理一个请求的过程中,总共耗时100+5=105ms,而其中只有5ms是用于计算操作的,CPU利用率为5/(100+5)。使用线程池是为了尽量提高CPU的利用率,减少对CPU资源的浪费,假设以100%的CPU利用率来说,要达到100%的CPU利用率,对于一个CPU就要设置其利用率的倒数个数的线程数,也即1/(5/(100+5))=21,4个CPU的话就乘以4。那么算下来的话,就是……84,这个时候线程池要设置84个线程数,然后连接池也是设置为84个连接。