发表于:2020/7/26 15:10:23
#0楼
1. 现象分析
现场阀岛采用环网连接,阀岛每隔一段时间会出现掉网现象,大约一天3到5次。现场阀岛通过profinet总线串联到交换机网络恢复后,环网又重新建立,扫描网络拓扑物理连接并未断开。
2. 查找原因
2.1 网线有接触不良之处或有屏蔽层未接好,造成网线断开之后又重新连上。
2.2 环网中有一根网线过长,因为以太网避免冲突的协议是采用带冲突检测的载波监听多路访问,即使这种检测机制能避免大多数冲突,但也是在网线长度在100米以内才能有效避免大多数冲突。
2.3 当网络拥堵时,交换机在看门狗周期内未收到环网中所有设备发送的数据,认为设备已经掉网,网线断开,重新构造网络拓扑结构,构网时间为200ms以下,在重构网络的时候,所有设备处于掉网状态。
3.排查步骤
3.1紧固所有网线插头
测试方式;因夜班无设备动作,相对白天电磁干扰较小的情况下仍掉网,故先不考虑屏蔽层未接好的因素。先将环网内所有设备网现插头拧紧,观察现象。
现象:仍有掉网,排除网线接触不良的影响。
3.2 拔网线,消除环网测试
测试方式;将环网中其中一处网线拔出,消除环网观察现象。
现象:无掉网现象(时间3-5天)。
3.3 加长看门狗时间
测试方式;插上拔出的网线,仍然连接为环网。看门狗周期由原来的3倍扫描周期改为8倍扫描周期,更细心时间为2ms,即看门狗时间由6ms改为16ms。
现象;仍然掉网。
3.4 再次加长看门狗时间
测试方式;插上拔出的网线,仍然连接为环网。看门狗周期由原来的8倍扫描周期改为120倍扫描周期,更细心时间为2ms,即看门狗时间由6ms改为240ms。
现象;无掉网。(时间3-5天)
4.总结
根本原因是交换机在看门狗时间内未收到阀岛发出的数据,导致掉网。
其实,这与网线长度,网络中数据包的数量,外部的干扰都有关系。
但是,只要记住一点,先保证物理层连接没有问题,接好屏蔽层,然后网线不要太长,适当加长看门狗周期就可以解决掉网问题。
最终修改看看门狗周期为120倍更新时间,即240ms。
希望大家遇到问题不着急,仔细分析可能的原因,一项一项排查,你就能找到你要答案。
现场阀岛采用环网连接,阀岛每隔一段时间会出现掉网现象,大约一天3到5次。现场阀岛通过profinet总线串联到交换机网络恢复后,环网又重新建立,扫描网络拓扑物理连接并未断开。
2. 查找原因
2.1 网线有接触不良之处或有屏蔽层未接好,造成网线断开之后又重新连上。
2.2 环网中有一根网线过长,因为以太网避免冲突的协议是采用带冲突检测的载波监听多路访问,即使这种检测机制能避免大多数冲突,但也是在网线长度在100米以内才能有效避免大多数冲突。
2.3 当网络拥堵时,交换机在看门狗周期内未收到环网中所有设备发送的数据,认为设备已经掉网,网线断开,重新构造网络拓扑结构,构网时间为200ms以下,在重构网络的时候,所有设备处于掉网状态。
3.排查步骤
3.1紧固所有网线插头
测试方式;因夜班无设备动作,相对白天电磁干扰较小的情况下仍掉网,故先不考虑屏蔽层未接好的因素。先将环网内所有设备网现插头拧紧,观察现象。
现象:仍有掉网,排除网线接触不良的影响。
3.2 拔网线,消除环网测试
测试方式;将环网中其中一处网线拔出,消除环网观察现象。
现象:无掉网现象(时间3-5天)。
3.3 加长看门狗时间
测试方式;插上拔出的网线,仍然连接为环网。看门狗周期由原来的3倍扫描周期改为8倍扫描周期,更细心时间为2ms,即看门狗时间由6ms改为16ms。
现象;仍然掉网。
3.4 再次加长看门狗时间
测试方式;插上拔出的网线,仍然连接为环网。看门狗周期由原来的8倍扫描周期改为120倍扫描周期,更细心时间为2ms,即看门狗时间由6ms改为240ms。
现象;无掉网。(时间3-5天)
4.总结
根本原因是交换机在看门狗时间内未收到阀岛发出的数据,导致掉网。
其实,这与网线长度,网络中数据包的数量,外部的干扰都有关系。
但是,只要记住一点,先保证物理层连接没有问题,接好屏蔽层,然后网线不要太长,适当加长看门狗周期就可以解决掉网问题。
最终修改看看门狗周期为120倍更新时间,即240ms。
希望大家遇到问题不着急,仔细分析可能的原因,一项一项排查,你就能找到你要答案。
[此贴子已经被jint于2020/7/27 8:52:37编辑过]