锐捷ruijie DHCP类故障通用排查思路
发表时间:2022-08-28 01:18:08
文章来源:超级管理员
浏览次数:804
工程师碰到上述故障时,可以参考如下排查思路,定位问题点:
1)确认故障真实现象
2)确认故障涉及的网络环境,特别是拓扑
工程师必须首先掌握网络拓扑图,至少是故障点到DHCP SERVER所在设备的整个数据通路上所涉及到的所有网络设备,以及他们之间的物理互联情况,另外还需要考虑一些特殊环境因素可能造成的影响,比如PVLAN应用,SUPER VLAN应用,MSTP的block端口,是否存在DHCP SERVER欺骗,链路上的加密机是否过滤掉了bootps(UDP 68),bootpc(UDP 67)端口等
3)确认配置是否正确,是否有改动
确认关于DHCP SERVER的一些配置是否正确,是否有被修改过,是否存在一些特殊的参数配置(比如配置client-identifier以实现某个已知的PC获取固定的一个ip地址),是否存在其他冲突的功能配置(比如配置了ACL过滤掉相应地址或者端口)
4)测试故障点到DHCP SERVER间的连通性
可以通过手动设置静态ip来测试故障机与DHCP SERVER间的通信是否是正常的。
5)通过显示与监控命令来判断故障点
如果配置,联通性没有问题,那就可以通过show,debug命令来查看,监控当前DHCP SERVER设备的一个工作状态,协议是否正常响应等。
在RGOS 10.4(3)平台上的常见显示及监控命令如下:
show dhcp lease
show ip dhcp binding
show ip dhcp conflict
show ip dhcp server statistics
debug ip dhcp client
debug ip dhcp server
6)通过逐点抓包,分析报文定位故障点
通过在故障机,DHCP SERVER端接口,必要时可能还需要数据通路上的逐点抓包,分析报文交互过程及字段结构等,对比相应RFC文档来判断故障设备,是否环境因素还是软件bug,特别是涉及第三方设备的时候。