一次MySQL主从搭建出现“Last_IO_Errno: 1236”错误的处理记录


今天在搭建一个MySQL master-slave集群时,执行了change master命令,然后又 start slave 启动slave服务,结果查看salve状态就出现错误了:


mysql> show slave status\G
*************************** 1. row ***************************
               Slave_IO_State:
                  Master_Host: 192.168.62.108
                  Master_User: repl
                  Master_Port: 3307
                Connect_Retry: 60
              Master_Log_File: mysql-bin.000544
          Read_Master_Log_Pos: 76175557
               Relay_Log_File: mysql-relay-bin.000001
                Relay_Log_Pos: 4
        Relay_Master_Log_File: mysql-bin.000544
             Slave_IO_Running: No
            Slave_SQL_Running: Yes
              Replicate_Do_DB:
          Replicate_Ignore_DB:
           Replicate_Do_Table:
       Replicate_Ignore_Table:
      Replicate_Wild_Do_Table:
  Replicate_Wild_Ignore_Table:
                   Last_Errno: 0
                   Last_Error:
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 76175557
              Relay_Log_Space: 107
              Until_Condition: None
               Until_Log_File:
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
           Master_SSL_CA_File:
           Master_SSL_CA_Path:
              Master_SSL_Cert:
            Master_SSL_Cipher:
               Master_SSL_Key:
        Seconds_Behind_Master: NULL
Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 1236
                Last_IO_Error: Got fatal error 1236 from master when reading data from binary log: 'Could not find first log file name in binary log index file'
               Last_SQL_Errno: 0
               Last_SQL_Error:
  Replicate_Ignore_Server_Ids:
             Master_Server_Id: 621083307
1 row in set (0.00 sec)

错误提示的内容,按照字面意思:
最后的IO错误为 1236; 当从binlog 中读取数据时,master返回一个1236的错误——在binlog索引文件中不能找到第一个日志文件。

之前我遇到这个错误,是因为搭建salve库时,使用的备份是master库7天前的备份,binlog设置默认保留天数为7天,过期的binlog日志文件都会被删除了。所以当时找不到最初binlog日志文件,所以提示这个错误。

于是我登录到 mysql master服务器上确认, mysql-bin.000544日志文件就是今天早上的,目前master正在写入的日志是mysql-bin.000550,肯定是存在,按说是可以读到的。
我查看是否还有其他原因,在网上一篇文章中看到,提示这样错误的原因可能是binlog日志文件不存在,或者binlog的名称没有写对,有空格。这个说法提醒了我,我的操作都是有记录的,赶快去确认开始执行的 change master 命令,结果发现是因为 一开始在进行 change master 命令时,binlog文件 的名称多一个空格,造成了binlog文件名称发生了变化,所以就找不到了。

处理方法:重新stop slave, 修改 change master确保binlog日志文件名称没有空格是正确的, 然后start slave 后状态正常。

通过这次故障,可以看出DBA在进行日常操作和故障处理时,还是需要更多的耐心和细心,这样才能避免更多的问题,尽快解决已经发生的问题。

************************************************
附:出现问题时查询到的网页内容为


MySQL Slave复制故障3例

1.Sandy飓风导致NYC机房停电,重启后看到的日志如下: 


121101 16:35:25 [ERROR] Slave I/O: Got fatal error 1236 from master when reading data from binary log: 'Client requested master to start replication from impossible position', Error_code: 1236

121101 16:35:25 [Note] Slave I/O thread exiting, read up to log 'mysql-bin.014497', position 38542146

121101 16:41:36 [Note] Error reading relay log event: slave SQL thread was killed


然后看binlog如下:

# at 38539267

#121101 13:11:04 server id 1  end_log_pos 38539294      Xid = 934362432

COMMIT/*!*/;

DELIMITER ;

# End of log file

ROLLBACK /* added by mysqlbinlog */;

/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;

master突然当机造成的masterpos要小于slave错误日志记录posmysql-bin.014497的最后一个位置是: end_log_pos 38539294,但没有被commit,所以上一个是 38539267 直接posmaster的最后有效的位置即可,

change master to master_log_file='mysql-bin.014497',master_log_pos=38539267;

但也有可能情况相反,可能slave了部分数据或延,此时把pos往前移,反复试验即可。


2. Got fatal error 1236: 'Could not find first log file name in binary log index file' from master when reading data from binary log

logfile有空格,或是master对应Log删了。


3. Show processlist 看到很多sleep,可能是应用代码做完query之后没用close()动关闭链接。这样会一直到timeout才断掉,但这个timeout太小的话,会mysql has gone away 这种错误。




  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: last_io_errno: 1236是指在最后一次输入/输出操作中出现错误代码1236错误代码1236代表数据库服务器连接超时。这意味着数据库服务器在规定的时间内未响应客户端的请求,可能因为网络问题或服务器负载过高。 当客户端与数据库服务器建立连接后,它会发送查询请求或执行其他操作。服务器必须在一定的时间内响应这些请求。如果服务器在规定时间内未能响应请求,就会发生超时错误。 造成连接超时的原因有很多,如网络延迟、服务器资源不足、数据库负载过高等。解决超时错误的方法包括: 1. 检查网络连接和服务器状况:确保网络连接稳定,并检查服务器的负载和可用资源是否充足,确保数据库服务器能够正常运行。 2. 调整连接超时时间:根据实际情况,适当延长连接超时时间,以便服务器有足够的时间来响应请求。这可以在数据库连接参数中进行相关设置。 3. 优化数据库查询:通过优化查询语句、创建索引和适当调整数据库设计等方式,提高数据库的查询性能,减少响应时间。 4. 分散负载:如果数据库服务器负载过高,可以考虑分散负载到多个服务器上,以提高整体性能。 5. 更新数据库和服务器软件版本:确保数据库和服务器软件版本是最新的,因为软件更新通常会修复一些性能和稳定性问题。 总之,last_io_errno: 1236是连接超时错误错误代码,通过检查网络连接、服务器负载情况和优化数据库查询等措施,可以解决这个问题。 ### 回答2: last_io_errno: 1236MySQL数据库的一个错误代码。该错误代码表示与主从复制相关的问题,具体是指主从数据库之间的连接出现错误。 在MySQL主从复制中,主数据库负责处理所有的写操作,并将这些写操作的日志记录发送到从数据库进行执行,以保持主从数据库的数据一致性。当从数据库无法连接到主数据库时,就会出现last_io_errno: 1236 错误。 造成last_io_errno: 1236 错误的原因可能有多种,其中包括网络问题、主数据库宕机或者设置的错误等。 解决这个错误的方法可以包括以下几步: 1. 检查网络连接是否正常,确保主数据库和从数据库之间的通信没有问题。 2. 检查主数据库是否正常运行,确保它没有宕机或者出现其他故障。 3. 检查MySQL主从复制的设置是否正确,包括主数据库的binlog配置和从数据库的replication配置是否正确。 4. 尝试重新启动从数据库,以确保它能够重新连接主数据库并进行同步。 如果上述方法无法解决问题,可能需要进一步排查错误的具体原因并根据具体情况采取不同的解决方法。可以通过查看MySQL错误日志或者运行相应的诊断命令来获取更多的错误信息,以便进行进一步的故障排除。 ### 回答3: last_io_errno: 1236是指最近一次I/O(输入/输出)操作发生的错误代码是1236错误代码1236MySQL数据库中的一个错误代码,表示一个问题出现处理复制操作时。具体来说,它指示从服务器无法连接到主服务器来获取或处理复制日志事件。 这个错误可能发生在主从复制设置中,当从服务器无法与主服务器建立连接时。可能的原因包括网络问题、访问权限问题或主服务器宕机等。如果无法建立连接,从服务器将无法获取主服务器上的更新日志,并无法进行数据复制。 为了解决这个问题,可以通过以下几个步骤来进行排查: 1. 确保网络连接正常:检查网络连接是否稳定,并确保从服务器能够与主服务器进行通信。 2. 检查访问权限:确保从服务器具有足够的权限来连接和复制主服务器上的数据。检查相关的用户权限和授权设置。 3. 检查主服务器状态:验证主服务器是否处于运行状态,确保没有出现宕机或其他故障。 4. 检查错误日志:查看MySQL错误日志文件,了解更多关于错误的详细信息。错误日志通常位于MySQL安装目录的日志文件夹中。 5. 重新启动从服务器:有时,重新启动从服务器可以解决临时的连接问题。 如果以上步骤都无法解决问题,可以考虑联系数据库管理员或MySQL技术支持人员,以获取更进一步的帮助和支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值