背景
最近一段时间,从公司远程访问家里的电脑时,遇到过两次外网突然中断的问题。每次处理方式都比较类似:先重启已经死机的服务器主机,再重启路由器,网络就能恢复正常。
因为前两次故障发生时我不在家,没办法现场观察,只能先记录现象,直到后来在家里复现了一次,才基本定位到原因。
故障现象
这次是在家里不小心踢到服务器主机后,路由器外网再次中断。当时服务器屏幕是关闭状态,我一开始还没意识到它已经死机。
当时观察到的现象是:
- 路由器重启后可以短暂联网。
- 很快出现“网络繁忙”状态。
- 随后外网再次断开。
- 局域网内其它设备也无法正常访问外网。
排查过程
1. 检查光猫状态
先检查光猫。光猫已经改成桥接模式,进入管理界面后看到光信号正常。
为了排除运营商线路问题,又用笔记本直接进行 PPPoE 拨号测试,结果可以正常拨号上网。
这说明问题大概率不在光猫,也不在外部线路。
2. 检查路由器状态
接着继续重启路由器,并查看路由器日志和连接状态。
这时发现一个关键现象:服务器主机占用了几乎全部带宽资源,导致其它正常设备无法建立外网连接,表现出来就像路由器外网断开一样。
3. 检查服务器状态
回头检查服务器,发现主机确实已经死机。
这也解释了前几次故障为什么都是“重启服务器 + 重启路由器”后恢复:真正的触发点不是路由器本身,而是服务器异常后持续占满网络资源,把整个家庭网络拖垮了。
初步结论
这次故障的链路大致是:
- 服务器主机异常死机。
- 死机后网卡或系统仍在异常发包。
- 服务器占满路由器带宽或连接资源。
- 其它设备访问外网失败。
- 重启服务器后,异常流量消失。
- 重启路由器后,网络状态恢复。
所以这类问题不能只盯着路由器和光猫看。家里如果有长期运行的服务器、NAS 或旁路由,一旦它们异常发包,也可能造成整个网络看起来像“外网断了”。
后续观察点
目前还不确定服务器死机后为什么会持续大量发包。下次如果再次遇到类似情况,可以优先检查下面几项:
- 服务器是否蓝屏或系统假死。
- 网卡灯是否异常高速闪烁。
- 路由器里是否能看到单台设备占满上传或下载。
- 是否和网络唤醒(Wake-on-LAN)有关。
- 是否存在网卡驱动、系统崩溃或硬件接触问题。
处理建议
为了避免类似问题再次影响整个家庭网络,可以考虑:
- 在路由器上给服务器设置带宽限制。
- 给服务器固定 IP,方便故障时快速定位。
- 开启路由器流量监控,观察单设备异常流量。
- 检查服务器网卡驱动和系统日志。
- 如果服务器经常死机,优先排查电源、内存、硬盘和散热。
这次问题本质上不是外网线路故障,而是局域网内服务器异常导致的网络资源被占满。排查这类问题时,先确认外部线路,再看路由器日志,最后定位到具体内网设备,会比反复重启路由器更有效。