exchange 2000邮件服务器修复
24号exchane 2000 邮件服务器发生故障应经瘫痪,需要做技术支持。
问题描述:
邮件服务器是hp的服务器,做了Raid 5。前几天突然系统反应迟钝,再然后系统死机,重启失败。于是请惠普的服务人员进行检修,经检修发现主板损坏,内存也发生了问题。更换硬件后系统依然不能启动。后用WinPe系统启动计算机,可以发现Raid5的卷但是看不到上边的数据。退出系统进入bios发现卷的配置完好,并且硬件没有发生过变化。无奈的情况下请数据恢复公司把系统中的数据拷贝了出来。
预备知识:
Exchange的灾难恢复,需要有活动目录的备份数据、邮件数据库的备份数据,而且操作系统的版本所安装的补丁必须和以前的系统完全一致,exchange的版本补丁以及各种设置也必须和以前的系统保持一致。否则邮件服务无法正常运行。
现有资料:
操作系统:windows Ad server 2000 是否打过补丁,打了哪个版本的补丁目前不清楚。
邮件系统:exchange server 2000 是否打过补丁,打了哪个版本的补丁不清楚。
AD角色:原邮件服务器是域控制器,是主域控制器还是辅助域控制器不清楚。
邮件安装路径:据回忆应该是安装到了D盘的exchsrvr文件夹。
操作主机角色:不清楚原主机在担任哪些操作主机的角色。
数据备份:原主机操作系统没有做过任何备份,原主机系统状态数据没有做过任何备份,邮件系统没有做过任何备份。
自我定位:
虽然依据微软给出的标准恢复方式,本次数据恢复的可能性比较低。但是以我个人的经验和感觉,认为还是很有希望恢复的,原因在于活动目录有辅助域控制器保留,邮件数据库也完整保存。但是难度也可想而知,只能依据具体情况具体解决了。
数据恢复过程:
使用灾难恢复模式进行exchange的安装,系统成功安装。
系统安装完成出现大量的错误,发现exchane在安装的时候路径错误,需要重新安装。而在安装的时候发现无论如何都无法修改安装路径。于是决定重新安装操作系统和exchange。
步骤一:操作系统的安装
由于是一台普通的Pc机作为服务器来安装所以安装过程比较顺利。将这台计算机安装为辅助域控制器。
问题:
系统安装完成后发现在拷贝邮件数据库到新机器的硬盘上上的时候特别慢,将近 90G 的数据却要拷贝20多个小时(原数据通过usb接口连接到新机器上)。
解决方法:
考虑可能是usb接口的版本低,据观察是2.0接口的。遂决定首先安装usb的驱动程序。果然安装完成后数据拷贝非常的快速。
步骤二:安装exchange 2000。
问题:
系统提示exchange,相关信息已经存在,无法安装
解决方法:
由于活动目录里边已经存在关于exchange的相关信息,因此在安装exchange的时候,关于活动目录的扩展操作将不能进行,写入活动目录的操作也不能进行。
因而采用灾难恢复模式进行安装 “setup /disasterrecovery”,完成后重新启动操作系统。
步骤三:解决系统服务问题:
重新启动系统完成后发现,exchange相关的各种服务无意能够正常启动。采用手动的方式启动同样以失败告终。决定从系统日志着手,逐一解决问题。
问题一:出现错误,提示无法找到域中的全局编录服务器。如下图所示:
解决方法:
在主域控制器中将自己设置为全局编录服务器并重新启动
验证主域控制器已经为全局编录服务器后重新启动新安装的邮件服务器,发现问题解决。
问题二:操作主机角色错误
查看系统日志,发现有提示无法找到域中的相对主机、pdc主机、基础结构主机的信息。查看域中操作主机的角色发现,角色在不正确的主机上。
解决方法:
进行主机角色的抢占。
步骤如下:
Microsoft Windows 2000 [Version 5.00.2195] (C) 版权所有 1985-2000 Microsoft Corp.
C:/>ntdsutil
ntdsutil: roles
fsmo maintenance: connections
server connections: connect to server ss.lrq.com 绑定到 ss.lrq.com ... 用本登录的用户的凭证连接 ss.lrq.com
server connections: quit
fsmo maintenance: seize pdc 在索取之前尝试安全传送 PDC FSMO。 ldap_modify_sW 错误 0x34(52 (没有). Ldap 扩展的错误消息为 000020AF: SvcErr: DSID -0321037F , problem 5002 (UNAVAILABLE ), data 8524
返回的 Win32 错误为 0x20af(请求的 FSMO 操作失败。不能连接当前的 FSMO 盒。) ) 根据错误编码这可能表示连接 ldap, 或角色传送错误。 PDC FSMO 的传送失败,用索取继续 ... 服务器 "ss.lrq.com" 知道有关 5 作用 架构 – CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com 域 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com PDC - CN=NTDS Settings,CN=SS,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com RID - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com 结构 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com
fsmo maintenance: seize rid master 在索取之前尝试安全传送 RID FSMO。 ldap_modify_sW 错误 0x34(52 (没有). Ldap 扩展的错误消息为 000020AF: SvcErr: DSID-03210629, problem 5002 (UNAVAILABLE ), data 8524
返回的 Win32 错误为 0x20af(请求的 FSMO 操作失败。不能连接当前的 FSMO 盒。) ) 根据错误编码这可能表示连接 ldap, 或角色传送错误。 RID FSMO 的传送失败,用索取继续 ... 将服务器 ss.lrq.com 与其邻居同步 这个操作要花几分钟 ....失败。
服务器 "ss.lrq.com" 知道有关 5 作用 架构 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com 域 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com PDC - CN=NTDS Settings,CN=SS,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com RID - CN=NTDS Settings,CN=SS,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com 结构 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com
fsmo maintenance: seize naming master Error 80070057 parsing input - illegal syntax? fsmo maintenance: seize infrastructure master 在索取之前尝试安全传送 infrastructure FSMO。 ldap_modify_sW 错误 0x34(52 (没有). Ldap 扩展的错误消息为 000020AF: SvcErr: DSID-032101BD, problem 5002 (UNAVAILABLE), data 8524
返回的 Win32 错误为 0x20af(请求的 FSMO 操作失败。不能连接当前的 FSMO 盒。) ) 根据错误编码这可能表示连接 ldap, 或角色传送错误。 infrastructure FSMO 的传送失败,用索取继续 ... 服务器 "ss.lrq.com" 知道有关 5 作用 架构 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com 域 - CN=NTDS Settings,CN=QQ,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com PDC - CN=NTDS Settings,CN=SS,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com RID - CN=NTDS Settings,CN=SS,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com 结构 - CN=NTDS Settings,CN=SS,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=lrq,DC=com fsmo maintenance: quit ntdsutil: quit 从 ss.lrq.com 断开...
C:/> |
重新启动系统后,相关提示不再出现,但是邮件服务依然无法启动。
问题三:exchange邮件存储服务无法启动
错误提示信息如下所示:
Event Type: Error Event Source: MSExchangeSA Event Category: General Event ID: 9022 Description: Microsoft Exchange System Attendant encountered an error while processing the security data for Exchange server ''.
For more information, click http://search.support.microsoft.com/search/?adv=1. Event Type: Error Event Source: MSExchangeSA Event Category: General Event ID: 9149 Description: Microsoft Exchange System Attendant failed to start Exchange server ''.Error code '0x80070005'. For more information, click http://search.support.microsoft.com/search/?adv=1. Event Type: Error Event Source: MSExchangeSA Event Category: General Event ID: 1005 Description: Unexpected error Access denied.Facility:LDAP Provider ID no:80070005 Microsoft Exchange System Attendant occurred. |
解决方法:使用“ADSI 编辑”授予正确的权限
1. 启动“ADSI 编辑”。
a. 单击开始,指向程序,然后单击 Windows 2000 支持工具。
b. 单击工具,然后单击 ADSI 编辑。
2. 依次展开
Configuration[youDomainName]--CN=Configuration,DC=domain,DC=com -- CN=services -- CN=Microsoft Exchange
3. 右键单击 YourOrganization,然后单击属性。
4. 单击安全选项卡,确保Exchange Domain Servers组具有“创建所有子对象”“删除所有子对象”权限。
5. 打开Exchange系统管理器。依次展开管理组、站点和服务器。
6. 右键单击服务器,然后单击属性。
7. 单击安全选项卡,验证服务器对象在帐户列表中的权限,然后验证完全控制所对应的允许复选框是否已选中。如果没有选中此权限,请单击以选中完全控制所对应的允许复选框,然后单击确定。
8. 退出“ADSI 编辑”。
9. 等待更改在域控制器中复制。
10. 启动系统助理。
通过上面的设置,等街一段时间后,重启Microsoft Exchange system Attendant服务,成功。
步骤四:确定操作系统的版本号
由于原系统只恢复了programe files文件夹的内容。所以在其中的common文件夹中依次查看每一个可执行程序和动态库的版本,并和安装了不同补丁的windows 2000系统相比较,最终确认操作系统的版本为打了sp4补丁的系统。
于是安装sp4补丁。
步骤五:去定exchange所安装的补丁版本号
到恢复出来的exchange安装问加价中,找到store.exe文件,查看其版本号。并于exchange各个不同版本的版本号相对应可知,exchange安装的补丁为sp3.
每个版本的 Exchange Server 有不同的版本号。
以下列出了每个版本的版本号和对应的发布日期:
名称 版本号 发布日期
------------------------------------------------------
Exchange 4.0 4.0.837 April 1996
Exchange 4.0 (a) 4.0.993 August 1996
Exchange 4.0 SP1 4.0.838 May 1996
Exchange 4.0 SP2 4.0.993 August 1996
Exchange 4.0 SP3 4.0.994 November 1996
Exchange 4.0 SP4 4.0.995 April 1997
Exchange 4.0 SP5 4.0.996 May 1998
Exchange 5.0 5.0.1457 March 1997
Exchange 5.0 SP1 5.0.1458 June 1997
Exchange 5.0 SP2 5.0.1460 February 1998
Exchange 5.5 5.5.1960 November 1997
Exchange 5.5 SP1 5.5.2232 July 1998
Exchange 5.5 SP2 5.5.2448 December 1998
Exchange 5.5 SP3 5.5.2650 September 1999
Exchange 5.5 SP4 5.5.2653 November 2000
Exchange 2000 6.0.4417 October 2000
Exchange 2000 (a) 6.0.4417 January 2001
Exchange 2000 SP1 6.0.4712 July 2001
Exchange 2000 SP2 6.0.5762 December 2001
Exchange 2000 SP3 6.0.6249 August 2002
Exchange 2000 post-SP3 6.0.6487 September 2003
Exchange Server 2003 6.5.6944 October 2003
Exchange Server 2003 SP1 6.5.7226 May 2004
于是安装exchange 2000 sp3补丁,命令为: update /disasterrecovery ,完成后重新启动。
步骤六:修复exchange邮箱存储数据库
1.Eseutil /mh ../mdbdata/priv1.edb
2.eseutil /p ../mdbdata/prive1.edb /t f:/
3. Eseutil /mh ../mdbdata/priv1.edb 查看数据库是否已经完整,否则不断运行修复命令。
由于数据库将近90个G所以要耐心等候,时间大概在几个小时。
步骤7:修复exchange公共文件夹存储数据库
1.Eseutil /mh ../mdbdata/pub1.edb
2.eseutil /p ../mdbdata/prub1.edb /t f:/
3. Eseutil /mh ../mdbdata/pub1.edb 查看数据库是否已经完整,否则不断运行修复命令。
由于数据库将近30个G所以要耐心等候。
步骤8:挂载exchange数据库
数据库成功挂载,Exchange数据库已经能够使用。
步骤九: 重新启动系统
发现,所有错误都已经解决
步骤十:检查用户帐户状况
打开活动目录用户和计算机管理工具发现部分账号存在错误如下图所示:
查看系统日志发现有错误原因的提示信息,如下图所示:
从中可以得知,这部分用户是由于被禁用造成的
在用户属性中进行确认,果然用户是停用状态的。
解决方法:
对这部分用户解除停用,问题解决。
步骤十一:可用性测试
使用系统管理员的邮箱测试收发是否正常
经测试管理员的1100封邮件都能够成功接受回来,测试成功。
步骤十二:系统备份
1.备份系统状态数据以防不测
2.备份exchange数据库以备恢复之用
至此完成本次修复工作。
总结:
1. 没有做完整的备份策略的人必将会遇到非常大的麻烦。
2. 修复的流程回过头来看非常容易,但是从众多的问题中找到一条解决思路却非常消耗时间(整个过程大概花费了五天的时间)。
下列是日志中的错误信息,在修正了活动目录的错误和exchange版本问题后都能够自动解决
事件类型: 错误
事件来源: MSExchangeSA
事件种类: MAPI Session
事件 ID: 9175
日期: 2008-9-28
事件: 12:54:35
用户: N/A
计算机: MAIL
描述:
The MAPI call 'OpenMsgStore' failed with the following error:
Microsoft Exchange Server 计算机不可用。原因可能是网络出现问题,或者是 Microsoft Exchange Server 正处于停机维护阶段。
The MAPI provider failed.
Microsoft Exchange Server 信息存储
ID no: 8004011d-0526-00000000
For more information, click http://www.microsoft.com/contentredirect.asp.
事件类型: 信息
事件来源: MSExchangeIS Mailbox Store
事件种类: General
事件 ID: 1217
日期: 2008-9-28
事件: 12:54:47
用户: N/A
计算机: MAIL
描述:
The information store database "First Storage Group/Mailbox Store (MAIL)" has unlimited storage capacity enabled.
For more information, click http://www.microsoft.com/contentredirect.asp.
事件类型: 错误
事件来源: MSExchangeIS
事件种类: General
事件 ID: 9519
日期: 2008-9-28
事件: 12:54:48
用户: N/A
计算机: MAIL
描述:
Error 0x451 starting database "First Storage Group/Mailbox Store (MAIL)" on the Microsoft Exchange Information Store.
Failed to configure MDB.
For more information, click http://www.microsoft.com/contentredirect.asp.
事件类型: 错误
事件来源: MSExchangeIS
事件种类: General
事件 ID: 9518
日期: 2008-9-28
事件: 12:54:48
用户: N/A
计算机: MAIL
描述:
Error 0x451 starting Storage Group /DC=CN/DC=COM/DC=GEFUND/CN=CONFIGURATION/CN=SERVICES/CN=MICROSOFT EXCHANGE/CN=GEFUND/CN=ADMINISTRATIVE GROUPS/CN=FIRST ADMINISTRATIVE GROUP/CN=SERVERS/CN=MAIL/CN=INFORMATIONSTORE/CN=FIRST STORAGE GROUP on the Microsoft Exchange Information Store.
MDB failed to start.
For more information, click http://www.microsoft.com/contentredirect.asp.
李荣权