
2026.05 辽宁·锦州·凌海·九华山小布达拉宫
一、故障发现
- 客户端域登录异常:部分客户端无法正常登录域环境,提示认证失败。
- 系统时间偏移:所有客户端及服务端系统时间与北京标准时间存在约 7分钟偏差。
- 域控同步失败:主域控(PDC)与辅助域控(ADC)之间无法完成正常同步。
二、故障分析
经排查,定位以下问题原因:
2.1 时间同步链路断裂
- 辅助域控(ADC)的时间同步源为主域控(PDC)。
- 主域控(PDC)的时间同步源为服务器主板硬件时钟,无法连接上游NTP服务器(10.64.1.30)。
- 根本原因:组策略中NTP服务器配置错误或未正确下发,导致PDC未指向外部可靠时间源。
2.2 怀疑时间偏差引发Kerberos认证异常
- Kerberos认证协议对时间差敏感(默认最大允许偏差为 5分钟)。
- 当前系统时间偏差达到 7分钟,超出Kerberos容忍范围,导致:
- 客户端域登录认证失败。
- 辅助域控访问主域控共享文件夹失败(提示访问拒绝或凭据错误)。
2.3 疑似辅助域控元数据可能受损
- 辅助域控可以正常访问主域控的以下服务与端口:
- AD服务(LDAP:389)
- Kerberos(88)
- SMB(445)
- DNS(53)
- 但无法访问主域控的共享文件夹(SYSVOL/NETLOGON)。
- 初步怀疑:
- 时间偏差导致Kerberos票据失效,SMB会话无法建立。
- 或辅助域控的AD元数据(metadata)存在损坏。
三、故障处理过程
3.1 执行系统备份
在主域控与辅助域控上安装Windows Server Backup工具
在主域控与辅助域控上执行首次备份
在客户端上查看组策略执行结果
gpresult /h C:\temp\gpresult.html
|
- 经与甲方分析, 甲方同意删除主辅域控上的网络安全管理软件
- 通过 w32tm 工具测试,发现原定上游NTP服务器110.164.11.130 无效,其UDP 123端口在当前网络无法触达
w32tm 工具测试,发现原定上游NTP服务器110.164.11.130 无效,其UDP 123端口
|
3.2 强制将辅助域控降级并重建辅助域控
- 检查主域控是否正常
1. 主域控是否持有所有 FSMO 角色 netdom query fsmo 2. 主域控 AD 数据库是否正常 ntdsutil "activate instance ntds" "files" "info" quit quit 3. 查询唯一的GC服务器是否是主域控 repadmin /showrepl | findstr "GC" dsquery server -isgc 4. 检查辅域控上的 DNS、组策略条数、主机信息、证书服务等
|
- 使用dcpromo或者服务管理器进行降级操作
1. 服务器管理器 → 管理 → 删除角色和功能 → 取消勾选"Active Directory 域服务" → 降级此域控制器 2. 重启服务器
|
- 重新加域以及提升为域控服务器
1. 清理主域控上的残余配置信息 2. 检查和配置辅助域控主机的网络信息,并检查与主域控的连通性 3. 使用 dcpromo 重新执行加域操作,并重启 4. 执行校验
|
3.3 手动时间同步修复
- 手动同步主域控时间:
# 以管理员身份执行 # 停止服务 net stop w32time # 取消注册 w32tm /unregister w32tm /config /manualpeerlist:"110.164.11.130,0x8" /syncfromflags:manual /reliable:yes /update w32tm /register # 启动时间服务,并同步 net stop w32time && net start w32time w32tm /resync
|
- 验证同步状态:
w32tm /query /status w32tm /query /source
|
检查并修正组策略:
- 路径:
Computer Configuration → Administrative Templates → System → Windows Time Service → Time Providers
- 配置 “Configure Windows NTP Client” 策略,指定上游NTP服务器地址。
- 执行
gpupdate /force 强制刷新策略。
辅助域控同步主域控时间:
w32tm /config /syncfromflags:domhier /update net stop w32time && net start w32time w32tm /resync
|
3.4 辅助域控同步恢复
- 时间偏差修复后,辅助域控与主域控的共享文件夹访问恢复正常。
- 执行强制复制同步:
- 检查复制状态:
repadmin /showrepl dcdiag /test:replications
|
3.5 客户端域登录验证
- 在客户端上执行命令检查登录域控是主还是辅助域控
- 选取故障客户端,执行:
w32tm /resync gpupdate /force
|
- 测试域用户登录,恢复正常。
四、处理结果
| 检查项 |
处理前 |
处理后 |
| 主域控时间同步 |
与主板同步,偏差7分钟 |
与NTP服务器同步,误差<1秒 |
| 辅助域控同步 |
失败 |
正常同步 |
| 客户端域登录 |
部分客户端失败 |
全部正常 |
| 共享文件夹访问 |
辅助域控无法访问 |
正常访问 |
| AD复制状态 |
报错 |
通过dcdiag测试正常 |
五、后续建议
- 同步更新域控服务器主板BIOS时间设置,防止重启后时间重置。
- 配置域控时间同步策略:建议在组策略中保留NTP服务器配置,配置稳定的硬件上游NTP服务器,避免因服务器重启或策略丢失再次出现时间偏差。
- 监控时间偏差:建议部署运维监控(如Zabbix)对域控服务器时间偏差进行告警(阈值:>30秒)。
- 定期检查AD复制状态:建议每周执行
dcdiag 和 repadmin /showrepl 检查复制健康状态。
- 备份AD数据库:建议通过WSB工具定期备份系统状态(System State),以应对AD元数据损坏场景。