连不上mysql时一般有以下四种报错:

1:Can't connect to MySQL server

2:Lost connection to MySQL server

3:Sorry, due to line fault, temporarily unable to browse, we are dealing with.

4:MySQL server has gone away


一:Can't connect to MySQL server 

可能的原因:

1,mysql服务端没有启起来

2,网络不通(iptables,selinux,网络不稳定)


对应的解决方案:

1,dba先确定mysql服务是否正常

2,mysql服务正常的情况下找运维确认网络问题


二: Lost connection to MySQL server

有四种情况可能会导致这样的报错:

1,网络问题

2,查询的结果集太大,比如一个查询要返回几百万个结果

3,客户端发起数据库连接的时候由于connect_timeout设置时间太短而报错,如果是由于这个原因引起的报错可以通过SHOW GLOBAL STATUS LIKE 'Aborted_connects'查看这个值是否有增加

4,查询有blob类型,超过了max_allowed_packet参数的限制


这四种情况对应的解决方案:

1,运维监控网络是否有问题

2,将 net_read_timeout值调大

3,将connect_timeout值调大

4,将max_allowed_packet值调大


三: Sorry, due to line fault, temporarily unable to browse, we are dealing with.

这个错误不是mysql原生的错误,在网上也没有找到有类似的资料.目前发现有三种情况会有这种报错:

1,网络有问题

2,数据库连接数过多

3,连数据库的帐号密码有误


四: MySQL server has gone away

有以下12种情况可能会导致这样的报错:

1,默认的wait_timeout值为8个小时,如果空闲连接超过这个值会被kill

2,dba手动kill

3,客户端的帐号没有权限连接mysql server

4,客户端TCP/IP连接超时,如使用mysql_options(..., MYSQL_OPT_READ_TIMEOUT,...)或者mysql_options(..., MYSQL_OPT_WRITE_TIMEOUT,...)函数

5,当客户端禁用了自动重连接( automatic reconnection)

6,查询语句不正确

7,查询语句太长,超过了max_allowed_packet的限制

8,一条insert或者replace语句更新的行数过多

9,域名解析失败

10,防火墙屏蔽了3306端口

11,一个线程fork了多个子进程,当多个子进程共用一个连接时会导致报错

12,mysql服务端挂了


报MySQL server has gone away的错误原因比较多,我们可以从三个方面来应对这个问题:

1,运维

a,确认防火墙规则

b,dns服务器无异常

d,合理配置php.ini中连接mysql的参数

connect_timeout,默认为60s

mysqli.reconnect,默认为off

2,DBA

a,确定mysql服务和连接数无异常

b,设置合理的wait_timeout值

c,设置在服务器端合理的max_allowed_packet值

d,确认帐号权限无误

3,开发

a,建议使用mysqli替代mysql

b,尽量少用长连接

c,mysqli.ping()可以在连接断开后自动重连,mysql.ping()从mysql5.0.3后就不支持自动重连了

d,子进程之间不要共用一个数据库连接

我们来看一下max_allowed_packet和超时有关的参数: 

>show variables like 'max_allowed_packet';

+--------------------+------------+

| Variable_name | Value |

+--------------------+------------+

| max_allowed_packet | 1073741824 |

+--------------------+------------+

>show variables like '%timeout%';

+-----------------------------+----------+

| Variable_name | Value |

+-----------------------------+----------+

| connect_timeout | 60 |

| delayed_insert_timeout | 300 |

| have_statement_timeout | YES |

| innodb_flush_log_at_timeout | 1 |

| innodb_lock_wait_timeout | 120 |

| innodb_rollback_on_timeout | OFF |

| interactive_timeout | 86400 |

| lock_wait_timeout | 31536000 |

| net_read_timeout | 120 |

| net_write_timeout | 120 |

| rpl_stop_slave_timeout | 31536000 |

| slave_net_timeout | 3600 |

| thread_pool_idle_timeout | 60 |

| wait_timeout | 86400 |

+-----------------------------+----------+


来看一下这几个与连不上数据库相关的超时参数:

connect_timeout:在获取链接时,等待握手的超时时间,一般默认即可(10s),为了避免因为网络不佳导致连接拥塞可以适当增大这个值.线上配置为60s

wait_timeout/interactive_timeout:连接状态持续为sleep的超时时间,默认为28800(8小时),现上调整到了24小时

net_read_timeout:服务器端等待客户端发送数据的超时时间,默认60s,线上为120s

net_write_timeout:服务器端写数据到客户端的超时时间,默认60s,线上为120s

再看一下max_allowed_packet参数:max_allowed_packet的默认值是1M(1048576),最大值是1G(1073741824),我们目前线上的值已经是上限值了.