发表于:2004/11/23 22:35:00
#0楼
如何确保FF和Profibus PA网络的高可靠性
作者:CONTROL ENGINEERING
过程工业中,现场总线系统的使用不断增加。
但是,这不是故事的结尾。它们还需要进一步改善,需要更简便的维护。
如果现在再提到现场总线系统是否能用于过程工业控制这个问题,会显得多余,各种现场总线正不断形成标准。
即使这样,进一步优化的问题也需要认真考虑。例如,提高系统的可靠性,故障的追踪能力以及现场总线系统的安全性等。
我们将在此讨论一些问题的可能性,并给出成功构建和维护总线系统或网络的指导意见。有关这些问题的信息是基于我们在Profibus PA和FF系统的经验,但是这些方法也能适应于其他确定性网络。
问题1:设备的自动删除问题
一个确定性网络在运行时,将特定的信息包传送到网络的各种设备上。如果信息包没有收到,将再进行重新发送。对于确定的网络 FF和Profibus PA,如果网络中的一个设备(如压力、温度或流量计)不能对信息做出连续的响应,那么,系统将认定此设备不再具有通信能力。
FF使用传递令牌通信方式,每个设备从链路活动调度器(Link Active Scheduler,LAS)接收到令牌(请求)后,设备必须通过归还令牌命令将令牌归还给LAS。如果设备不能连续三次响应令牌,LAS将从网络中隔离此设备。这三次的值将记录在FF系统中。对于Profibus PA系统,这个值以"最大重试限制(maximum retry limit)"的方式由用户定义
如果设备发现一个故障,它当然不再具有响应能力,系统将直接把此设备从网络中删除。
但是,一个设备有可能因为信息包的内容由于与协议软件检测时的不符而不能对信息包进行响应。这样的故障事实上有可能只一个bit的错误,这一错误可能是由于EMI产生,或者是在EMI传感设备的网络中产生。因而,不能响应请求,成为错误通信(miscommunication)。
在FF系统中,错误通信有可能会导致设备从网络中被暂时的删除,如果由于EMI等原因,仪器不能对连续三次的令牌进行响应,此类现象即可发生。而设备事实上并没有发生故障,它将通过协议再次报告,一段时间之后将恢复其功能。但是,这样的暂时的无效现象,在工业中是不能被接受的。
方案1:降低限制
图1表示在FF系统中的概况。图中表示出一个设备从网络中被删除(退出)的可能性,以三次连续未能向令牌响应的情况(未能送回令牌)下,出现的错误通信的百分比表示。可以发现,错误通信的百分比为0.01%时,意味着每500,000个bit中,将可能出现一次错误。Profibus PA系统的比特误差更高,10^-5。
从图1可见,在错误通信的概率小于0.01%时,FF系统在曲线中位于一个较为敏感的区域。错误通信的概率若在0.01%意味着每10,000个请求(令牌)中设备将出现一次不能响应(传回令牌)。
目前,设备的错误通信率一般小于0.01%。但是这个百分比(这里指比特误差)值只要稍微有些高出,设备就会好不犹豫地被自动地退出系统。这种风险存在于网络的整个生命周期中。换句话说,网络的基本结构的质量会由于某些原因而陷入恶化,这将直接影响到网络的可靠性。
同样,由图1可见,若降低限制,其作用可能更大,它使设备错误通信的可能性更加微小。如果规定在错过7个连续令牌回复的命令后,一个设备才从网络中被删除,这样,即使错误通信大幅度增长,所产生的影响也不会很大。这个仪器将继续在网络中稳定的运行。
放松限制的尺度,也对网络的可靠性很重要。这并不是说,在实际应用中要接受更高的比特误差。只是意味着在比特误差增加的情况下,能降低对网络的影响。
从此可以得出结论,在一个确定的网络中,采用一个可调整的限制尺度,这个方法将是可取的。在限制中所的规定的频率,要依据可靠性的具体情况得出。
问题2:缓慢增长的比特误差率
正如先前提到的,设备在网络中的暂时失效,在工业行业中是不能被接受的。但是,如果这种情况仍然发生,你怎样才能确定设备失效的真实原因呢。
答案很简单:事实上是不可能的。
以下为例,安装50个H1网络,假定这些网络中的每个部分每个月出现以上情况一次。一个操作员观察设备失效以及用示波器或总线监视器记录监测网络,他采用的这些物理方法所进行的检测,得到结果的概率几乎为零。
前面建议的关于放松失效限制的观点,也有缺陷。如果一个网络的稳定性要依赖降低限制,在通信方面的潜在的威胁则会因为被掩盖将不再能被轻易察觉。当网络需要进行稳定运行时,似乎没有必要进行功能的检测。其结果是,比特误差将无法察觉,不断增长,也不能分析出准确的原因。这个是一个较大风险,特别是关于网络的安全应用,当超出了规定的最大比特误差率,缓慢增长的比特误差将最终导致整个安装系统的失效。
方案2:导入维护计数器
因此,现在的问题是,是否存在可能性既保证网络性能又不影响工厂的实用性。据我们所知,这个问题可采用如下的方法。
可以再导入一个计数器,一个"预警"设备。这个用于失效限制准则第二个计数器应该针对每个网络进行个别调整,以确保用户所要求的系统敏感性。当三个回复令牌命令连续丢失时,这个计数器(维护计数器)会被设置。当出现一个事件,计数器将增加一个值,并激活主系统的离散输出。输出能由示波器或总线监视器记录,并在事件发生时停止。
通过导入这样的维护计数器,控制离散输出模块,记录测量数据,这就有可能将数据和事件直接联系。这意味着,用户将能正确地分析数据,且更快捷,更有效,在技术上进行补救的可能性也更大。
这样用户可决定需要分析哪个网络,计数器在网络层和设备层都具有易读性和重设置性。最终用户当然也可得到所有的信息,以评估网络的通信性能。
作者:CONTROL ENGINEERING
过程工业中,现场总线系统的使用不断增加。
但是,这不是故事的结尾。它们还需要进一步改善,需要更简便的维护。
如果现在再提到现场总线系统是否能用于过程工业控制这个问题,会显得多余,各种现场总线正不断形成标准。
即使这样,进一步优化的问题也需要认真考虑。例如,提高系统的可靠性,故障的追踪能力以及现场总线系统的安全性等。
我们将在此讨论一些问题的可能性,并给出成功构建和维护总线系统或网络的指导意见。有关这些问题的信息是基于我们在Profibus PA和FF系统的经验,但是这些方法也能适应于其他确定性网络。
问题1:设备的自动删除问题
一个确定性网络在运行时,将特定的信息包传送到网络的各种设备上。如果信息包没有收到,将再进行重新发送。对于确定的网络 FF和Profibus PA,如果网络中的一个设备(如压力、温度或流量计)不能对信息做出连续的响应,那么,系统将认定此设备不再具有通信能力。
FF使用传递令牌通信方式,每个设备从链路活动调度器(Link Active Scheduler,LAS)接收到令牌(请求)后,设备必须通过归还令牌命令将令牌归还给LAS。如果设备不能连续三次响应令牌,LAS将从网络中隔离此设备。这三次的值将记录在FF系统中。对于Profibus PA系统,这个值以"最大重试限制(maximum retry limit)"的方式由用户定义
如果设备发现一个故障,它当然不再具有响应能力,系统将直接把此设备从网络中删除。
但是,一个设备有可能因为信息包的内容由于与协议软件检测时的不符而不能对信息包进行响应。这样的故障事实上有可能只一个bit的错误,这一错误可能是由于EMI产生,或者是在EMI传感设备的网络中产生。因而,不能响应请求,成为错误通信(miscommunication)。
在FF系统中,错误通信有可能会导致设备从网络中被暂时的删除,如果由于EMI等原因,仪器不能对连续三次的令牌进行响应,此类现象即可发生。而设备事实上并没有发生故障,它将通过协议再次报告,一段时间之后将恢复其功能。但是,这样的暂时的无效现象,在工业中是不能被接受的。
方案1:降低限制
图1表示在FF系统中的概况。图中表示出一个设备从网络中被删除(退出)的可能性,以三次连续未能向令牌响应的情况(未能送回令牌)下,出现的错误通信的百分比表示。可以发现,错误通信的百分比为0.01%时,意味着每500,000个bit中,将可能出现一次错误。Profibus PA系统的比特误差更高,10^-5。
从图1可见,在错误通信的概率小于0.01%时,FF系统在曲线中位于一个较为敏感的区域。错误通信的概率若在0.01%意味着每10,000个请求(令牌)中设备将出现一次不能响应(传回令牌)。
目前,设备的错误通信率一般小于0.01%。但是这个百分比(这里指比特误差)值只要稍微有些高出,设备就会好不犹豫地被自动地退出系统。这种风险存在于网络的整个生命周期中。换句话说,网络的基本结构的质量会由于某些原因而陷入恶化,这将直接影响到网络的可靠性。
同样,由图1可见,若降低限制,其作用可能更大,它使设备错误通信的可能性更加微小。如果规定在错过7个连续令牌回复的命令后,一个设备才从网络中被删除,这样,即使错误通信大幅度增长,所产生的影响也不会很大。这个仪器将继续在网络中稳定的运行。
放松限制的尺度,也对网络的可靠性很重要。这并不是说,在实际应用中要接受更高的比特误差。只是意味着在比特误差增加的情况下,能降低对网络的影响。
从此可以得出结论,在一个确定的网络中,采用一个可调整的限制尺度,这个方法将是可取的。在限制中所的规定的频率,要依据可靠性的具体情况得出。
问题2:缓慢增长的比特误差率
正如先前提到的,设备在网络中的暂时失效,在工业行业中是不能被接受的。但是,如果这种情况仍然发生,你怎样才能确定设备失效的真实原因呢。
答案很简单:事实上是不可能的。
以下为例,安装50个H1网络,假定这些网络中的每个部分每个月出现以上情况一次。一个操作员观察设备失效以及用示波器或总线监视器记录监测网络,他采用的这些物理方法所进行的检测,得到结果的概率几乎为零。
前面建议的关于放松失效限制的观点,也有缺陷。如果一个网络的稳定性要依赖降低限制,在通信方面的潜在的威胁则会因为被掩盖将不再能被轻易察觉。当网络需要进行稳定运行时,似乎没有必要进行功能的检测。其结果是,比特误差将无法察觉,不断增长,也不能分析出准确的原因。这个是一个较大风险,特别是关于网络的安全应用,当超出了规定的最大比特误差率,缓慢增长的比特误差将最终导致整个安装系统的失效。
方案2:导入维护计数器
因此,现在的问题是,是否存在可能性既保证网络性能又不影响工厂的实用性。据我们所知,这个问题可采用如下的方法。
可以再导入一个计数器,一个"预警"设备。这个用于失效限制准则第二个计数器应该针对每个网络进行个别调整,以确保用户所要求的系统敏感性。当三个回复令牌命令连续丢失时,这个计数器(维护计数器)会被设置。当出现一个事件,计数器将增加一个值,并激活主系统的离散输出。输出能由示波器或总线监视器记录,并在事件发生时停止。
通过导入这样的维护计数器,控制离散输出模块,记录测量数据,这就有可能将数据和事件直接联系。这意味着,用户将能正确地分析数据,且更快捷,更有效,在技术上进行补救的可能性也更大。
这样用户可决定需要分析哪个网络,计数器在网络层和设备层都具有易读性和重设置性。最终用户当然也可得到所有的信息,以评估网络的通信性能。