设备环境检查 |
|||
设备运行环境正常是保证设备正常运行的前提。 |
|||
建议维护周期 |
检查项 |
评估标准和说明 |
|
日 |
机房内空调运行是否正常 |
空调可持续稳定运行,使机房温度保持在设备可承受范围内。 |
|
电源连接是否正常可靠 |
电源线应正确地连接到设备的指定位置上,且连接牢固。设备的电源指示灯应常亮绿色。 |
||
周 |
机房温度及湿度状况 |
工作环境温度:0℃~45℃。 |
|
机房的长期工作环境相对湿度应在5%RH~85%RH之间,不结露;短期工作环境相对湿度应在0%RH~95%RH之间,不结露。 |
|||
若机房的环境温度长期不能满足要求,应考虑检修或更换机房的空调系统。 |
|||
若机房的相对湿度过大,应考虑为机房安装除湿设备;若机房的相对湿度过小,应考虑为机房安装加湿设备。 |
|||
散热状况 |
设备正常工作时,要求保持风扇正常运转(清理风扇期间除外),擅自关闭风扇会引起设备温度升高,并可能损坏单板。 |
||
设备周围无杂物。 |
|||
季度 |
线缆布放 |
电源线与业务线缆分开布放。电源线布放整齐、有序。业务线缆布放整齐、有序。 |
|
线缆标签 |
线缆标签清晰、准确,符合规范。 |
||
半年 |
清洁状况 |
防尘网除尘:注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。 |
|
所有项目都应干净整洁无明显尘土附着。 |
|||
年 |
风扇框除尘:注意风扇框的清洁状况,及时清洁,以免影响风扇框的稳定运行,对设备产生潜在的威胁。 |
||
设备基本信息检查 |
|||
检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。 |
|||
建议维护周期 |
检查项 |
检查方法 |
评估标准 |
月 |
设备运行的版本 |
<HUAWEI> display version |
单板PCB版本号、软件版本号与要求相符。 |
检查软件包 |
<HUAWEI> display startup |
设备正在使用及下次启动时将要加载的产品版本软件和配置文件的文件名正确。 |
|
License信息 |
<HUAWEI> display license |
License文件已经激活,且“Expired date”为“PERMANENT”(即永久有效)或在运行截至日期之内。 |
|
检查补丁信息 |
<HUAWEI> display patch-information |
补丁文件必须与实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。 |
|
补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。 |
|||
检查系统时间 |
<HUAWEI> display clock |
时间应与当地实际时间一致(时间差不大于5分钟),便于故障时通过时间精确定位。 |
|
如果不合格,请执行clock datetime命令修改系统时间或者配置NTP同步网络时间。 |
|||
CF卡中的文件(框式) |
<HUAWEI> dir cfcard: |
CFcard里的文件都必须是有用的,否则请执行delete/unreserved命令删除。 |
|
<HUAWEI> dir slave#cfcard: |
|||
检查Flash空间(盒式) |
<HUAWEI> dir flash: |
Flash里的文件都必须是有用的,否则请执行delete/unreserved命令删除。 |
|
检查配置正确性 |
<HUAWEI> display current-configuration |
通过查看当前生效的配置参数,验证设备配置是否正确。 |
|
检查debug开关 |
<HUAWEI> display debugging |
设备正常运行时debug开关应该全部关闭。 |
|
检查配置是否保存 |
<HUAWEI> compare configuration |
业务配置正常后,要进行保存。运行配置需要与保存过的配置相同。 |
|
设备运行检查 |
|||
检查设备的运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。 |
|||
建议维护周期 |
检查项 |
检查方法 |
评估标准 |
日 |
单板运行状态 |
<HUAWEI> display device |
重点关注单板在位信息及状态信息是否正常,当显示如下信息时表示为正常: |
单板“Online”为“Present” |
|||
单板“Power”为“PowerOn” |
|||
单板“Register”为“Registered” |
|||
单板“Status”为“Normal” |
|||
风扇状态 |
<HUAWEI> display fan |
“Register”为“Registered”表示正常。 |
|
电源状态 |
<HUAWEI> display power |
“state”为“supply”时表示正常。 |
|
告警信息 |
<HUAWEI> display alarm all |
无告警信息。 |
|
如果有告警,需要记录,对于严重以上告警需要立即分析并处理。 |
|||
CPU状态 |
<HUAWEI> display cpu-usage |
各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。 |
|
内存占用率 |
<HUAWEI> display memory-usage |
内存占用情况正常,如果“Memory Using Percentage”超过60%时需要关注。 |
|
日志信息 |
<HUAWEI> display logbuffer |
不存在异常信息。 |
|
<HUAWEI> display trapbuffer |
|||
温度检查 |
<HUAWEI> display temperature all |
各单板温度小于门限值5℃,状态为Normal状态。 |
|
月 |
FTP网络服务端口 |
<HUAWEI> display ftp-server |
不使用的FTP网络服务端口要关闭。 |
主用板/备用板的备份状态 |
<HUAWEI> display switchover state |
主备板同时存在时,要同时有主备板的显示状态信息。倒换完成,设备开始正常工作后,主用板需要显示为“realtime or routine backup”表示正常。 |
|
端口内容检查 |
|||
检查设备的端口信息,如端口协商模式、端口配置、端口状态等是否正确。 |
|||
建议维护周期 |
检查项 |
检查方法 |
评估标准 |
周 |
端口错包 |
<HUAWEI> display interface |
业务运行时,要检查端口有无错包,包括CRC错包等。 |
端口协商模式 |
<HUAWEI> display interface |
端口协商模式正确,两边端口要一致,不能有半双工模式。 |
|
端口配置 |
<HUAWEI> display current-configuration interface |
接口的配置项合理,如接口协商模式、速率、隔离、限速等。 |
|
端口状态 |
<HUAWEI> display interface brief |
端口的Up/Down状态满足规划要求。 |
|
端口统计数据 |
<HUAWEI> display ip interface |
分两次隔5分钟后收集数据,然后比较。正常情况下,第二次的数据有增长,且基数不大于500。 |
|
业务检查 |
|||
检查设备运行的业务是否正常。 |
|||
建议维护周期 |
检查项 |
检查方法 |
评估标准 |
周 |
组播成员接口和路由器接口信息 |
<HUAWEI> display igmp-snooping port-info |
静态成员接口、动态成员接口、静态路由器接口和动态路由器接口的信息正确。 |
组播报文统计信息 |
<HUAWEI> display igmp-snooping statistics vlan |
VLAN接收/发送的IGMP报文和PIM Hello报文个数,以及所有VLAN内发生的二层事件次数统计合理。 |
|
组播转发表信息 |
执行display l2-multicast forwarding-table命令查看二层组播转发表项。 |
组播转发表项正确。 |
|
执行display multicast forwarding-table命令查看三层组播转发表项。 |
|||
组播路由协议 |
执行display multicast routing-table命令。 |
域内组播路由协议采用PIM-SM。 |
|
与组播相连的接口都必须要使能IGMP。 |
|||
DHCP Snooping绑定表 |
<HUAWEI> display dhcp snooping user-bind all |
静态表项和动态表项正确。 |
|
MAC地址表信息 |
<HUAWEI> display mac-address |
MAC地址表信息正确。 |
|
路由表信息 |
<HUAWEI> display ip routing-table |
具有默认路由或者其他精确路由,便于故障时候可以远程定位。 |
|
对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。 |
|||
OSPF错包情况 |
执行display ospf error命令。分两次隔5分钟后收集数据,然后比较。 |
正常情况下,两次的数据没有增长。 |
|
VRRP状态 |
执行display vrrp命令。 |
“State”不为“Initialize”状态。 |
|
执行display vrrp statistics命令。 |
备份组中的设备的VRRP状态“State”不能同时为“Master”。 |
||
“Checksum errors”、“Version errors”和“Vrid errors”为零。 |
|||
防攻击检测 |
执行display current-configuration | include car命令。 |
应该有防攻击的配置。 |
|
如果未配置,请使用car命令为设备配置防攻击功能。具体步骤请参见《交换机配置指南-安全》中的“本机防攻击配置”。 |
|||
MSTP状态 |
执行display stp brief命令。 |
指定端口和根端口的“STP State”为“FORWARDING”。 |
|
备份根端口的“STP State”为“DISCARDING”。 |
|||
MST域配置信息 |
执行display stp region-configuration命令。 |
查看交换机上当前生效的MST域配置信息。 |
|
输出内容包括:域名、域的修订级别、VLAN与生成树实例的映射关系以及配置的摘要。 |
|||
MSTP拓扑变化 |
执行display stp topology-change命令。 |
查看MSTP拓扑变化相关的统计信息。 |
|
如果设备拓扑变化次数递增,则可以确定网络存在震荡。 |
|||
TC/TCN报文收发计数 |
执行display stp tc-bpdu statistics命令。 |
查看实例端口的TC/TCN报文收发计数。 |
|
LDT环路检测 |
执行display loop-detection命令。 |
LDT功能配置正常的情况下: |
|
执行display loop-detection [ interface { interface-type interface-number | interface-name }] |
“Following ports are block for loop”、“Following ports are shutdown for loop”下无端口,证明启动环路检测的VLAN中没有出现环路。 |
||
端口的“Status”为“Normal”,证明该端口所属的VLAN没有出现环路。 |
|||
OSPF邻居状态 |
执行display ospf peer命令。 |
OSPF邻居状态: |
|
IS-IS邻居状态 |
执行display ospf peer last-nbr-down命令。 |
邻居状态“State”为“Full”。 |
|
BGP邻居状态 |
执行display isis peer 命令。 |
正常情况下,要求该邻居建立时间不应该小于一天。 |
|
执行display bgp peer命令。 |
正常情况下,没有邻居down掉。 |
||
IS-IS邻居状态: |
|||
邻居状态“State”为“Up”。 |
|||
BGP邻居状态: |
|||
邻居状态“State”为“Established”。 |
|||
路由信息 |
执行display ip routing-table命令。与前一次记录的路由信息比较,检查是否由明显变化。 |
正常情况下,路由表中有默认路由。 |
|
并可抽样对其中的路由项进行ping或者tracert操作。 |
对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。 |
||
OSPF Router ID |
执行display current-configuration configuration ospf或者display router id命令。 |
指定Router ID为Loopback口地址。 |
|
如未分配Loopback口地址,则要指定为上行口地址或其他Down掉概率最小接口的地址。 |
|||
配置的Router ID必须与OSPF正在使用的Router ID一致。 |
|||
OSPF路由引入配置 |
执行display current-configuration configuration ospf命令。 |
尽量使用network发布路由,也可以通过import方式引入路由。 |
|
OSPF虚连接 |
执行display ospf vlink命令。 |
不允许使用虚连接。 |
|
OSPF STUB区域 |
执行display current-configuration configuration ospf命令。 |
STUB区域,不能有import-route命令。 |
|
BGP路由发布 |
执行display current-configuration configuration bgp命令。 |
除了VPN路由,禁止采用import-route命令发布IP路由。 |
|
应使用network命令和ip route-static ip-address { mask | mask-length } null0命令发布路由。 |
|||
IBGP邻居 |
执行display current-configuration configuration bgp命令。 |
基于协议稳定性的考虑,建议使用Loopback这类状态总为UP的接口建立邻居关系。 |
|
ISIS路由引入 |
执行display current-configuration configuration isis命令。 |
尽量使用network-entity发布路由,也可以通过import方式引入路由。 |
|
VLAN信息 |
执行display vlan命令。 |
查看所有VLAN的基本信息。 |
|
CPCAR流量检查 |
<HUAWEI> reset cpu-defend statistics all |
CPCAR统计不出现丢包计数。 |
|
<HUAWEI> display cpu-defend statistics all |
© 版权声明
THE END
喜欢就支持一下吧
暂无评论内容