分享技术 · 探索极限 · Code is Art
云计算 发布 2016-07-23 1.0k 阅读 约 3 分钟阅读

家庭网络故障排查:服务器死机导致外网中断

整理一次家庭服务器死机后异常占满网络资源、导致路由器外网看似中断的排查过程,包含光猫、PPPoE、路由器日志和后续处理建议。

背景

最近一段时间,从公司远程访问家里的电脑时,遇到过两次外网突然中断的问题。每次处理方式都比较类似:先重启已经死机的服务器主机,再重启路由器,网络就能恢复正常。

因为前两次故障发生时我不在家,没办法现场观察,只能先记录现象,直到后来在家里复现了一次,才基本定位到原因。

故障现象

这次是在家里不小心踢到服务器主机后,路由器外网再次中断。当时服务器屏幕是关闭状态,我一开始还没意识到它已经死机。

当时观察到的现象是:

  • 路由器重启后可以短暂联网。
  • 很快出现“网络繁忙”状态。
  • 随后外网再次断开。
  • 局域网内其它设备也无法正常访问外网。

排查过程

1. 检查光猫状态

先检查光猫。光猫已经改成桥接模式,进入管理界面后看到光信号正常。

为了排除运营商线路问题,又用笔记本直接进行 PPPoE 拨号测试,结果可以正常拨号上网。

这说明问题大概率不在光猫,也不在外部线路。

2. 检查路由器状态

接着继续重启路由器,并查看路由器日志和连接状态。

这时发现一个关键现象:服务器主机占用了几乎全部带宽资源,导致其它正常设备无法建立外网连接,表现出来就像路由器外网断开一样。

3. 检查服务器状态

回头检查服务器,发现主机确实已经死机。

这也解释了前几次故障为什么都是“重启服务器 + 重启路由器”后恢复:真正的触发点不是路由器本身,而是服务器异常后持续占满网络资源,把整个家庭网络拖垮了。

初步结论

这次故障的链路大致是:

  1. 服务器主机异常死机。
  2. 死机后网卡或系统仍在异常发包。
  3. 服务器占满路由器带宽或连接资源。
  4. 其它设备访问外网失败。
  5. 重启服务器后,异常流量消失。
  6. 重启路由器后,网络状态恢复。

所以这类问题不能只盯着路由器和光猫看。家里如果有长期运行的服务器、NAS 或旁路由,一旦它们异常发包,也可能造成整个网络看起来像“外网断了”。

后续观察点

目前还不确定服务器死机后为什么会持续大量发包。下次如果再次遇到类似情况,可以优先检查下面几项:

  • 服务器是否蓝屏或系统假死。
  • 网卡灯是否异常高速闪烁。
  • 路由器里是否能看到单台设备占满上传或下载。
  • 是否和网络唤醒(Wake-on-LAN)有关。
  • 是否存在网卡驱动、系统崩溃或硬件接触问题。

处理建议

为了避免类似问题再次影响整个家庭网络,可以考虑:

  • 在路由器上给服务器设置带宽限制。
  • 给服务器固定 IP,方便故障时快速定位。
  • 开启路由器流量监控,观察单设备异常流量。
  • 检查服务器网卡驱动和系统日志。
  • 如果服务器经常死机,优先排查电源、内存、硬盘和散热。

这次问题本质上不是外网线路故障,而是局域网内服务器异常导致的网络资源被占满。排查这类问题时,先确认外部线路,再看路由器日志,最后定位到具体内网设备,会比反复重启路由器更有效。

发表回复