发表于:2008/2/21 10:33:00
#0楼
本文关键字:视频 监视 视频编码器
随着人们安全意识的提高,视频监视系统日益普及,现已广泛应用于机场、银行、公共交通中心乃至私人住宅中。但传统模拟系统存在诸多问题,这促使人们希望转而采用数字系统。此外,随着计算机网络、半导体及视频压缩技术的日益推广,新一代视频监视系统将无疑采用数字技术,并将实行标准化技术,支持IP 网络。
就因特网协议视频监视系统 (VSIP) 而言,处理网络流量的硬件是摄像头系统的重要组成部分,因为视频信号要通过摄像头进行数字化、压缩处理,然后才传输到视频服务器,从而解决网络的带宽限制问题。DSP/GPP 等异构处理器架构有助于最大化系统性能。视频采集、存储和视频流都是中断密集型 (Interrupt intensive) 任务,我们可将其分配给 GPP 来处理,而高密度 MIPS 视频压缩工作则交给 DSP 去完成。数据传输给视频服务器后,服务器将压缩视频流作为文件存储在硬盘驱动器上,从而避免了像传统模拟存储设备那样出现视频质量下降问题。我们针对数字视频信号的压缩技术开发了多种标准,可分为以下两大类:
* 运动估算 (ME) 法:每 N 帧为一个图像组 (GOP)。我们对图像组中的第一帧进行独立编码,而对其它 (N-1) 帧来说,我们只将当前帧与其前面已编码的帧(即前向参考帧)的时差加以编码。常用的标准为 MPEG-2、MPEG-4、H.263 及 H.264。
* 静态影像压缩法:每个视频帧作为静态影像独立编码。最常用的标准为 JPEG。MJPEG 标准采用 JPEG 算法对每个帧进行编码。
运动估算法与静态影像压缩法的比较
显示了 H.264 编码器的结构图,与其它 ME 视频编码标准类似,H.264 编码器将输入影像分为多个16 x 16 像素的宏块 (MB) ,然后逐块处理。H.264 编码器包括正向路径和重构路径。正向路径将帧编码为比特位;重构路径从编码位中产生一个参考帧。下图中的 IDCT、IQ、 ME 和 MC分别代表(反向)离散余弦变换、(反向)量化、运动估算及运动补偿。
在正向路径中(从 DCT至 Q),每个宏块 (MB) 均可以帧内模式或帧间模式编码。在帧间模式下,运动估算 (ME) 模块将参考 MB 位于前面已编码的帧处;而在帧内模式下,参考MB 在当前帧中由采样形成。
重构路径 (从 IQ 至 IDCT)的目的是确保编码器和解码器采用相同的参考帧生成影像。否则就会累积编码器与解码器间的误差。
给出了 JPEG 编码器结构图。该编码器将输入影像分为多个 8x8 像素的模块,然后逐个处理。每个模块首先通过 DCT 模块,随后量化器根据量化矩阵对 DCT 系数进行取整。在此过程中,编码质量与压缩比均可根据量化步骤调节。最后熵编码器对量化器输出进行编码,并生成 JPEG 影像。
由于连续视频帧通常包括大量相关信息,因此 ME 方法可实现更高的压缩比。举例来说,就每秒 30 帧的标准 NTSC 分辨率而言,H.264 编码器能以 2 mbps 的速度进行视频编码,从而实现了平均压缩比高达 60:1 的影像质量。在影像质量相同的情况下,MJPEG 的压缩比则为10:1 至 15:1。
MJPEG 相对于 ME 方法有如下几点优势。首先,JPEG 需要的计算量和功耗相对大幅降低。此外,大多数PC 都配置了 JPEG 影像专用的解码及显示软件。如果记录特定事件只需一幅或几幅影像,比如人通过门口,那么 MJPEG 的效率会更高。如果网络带宽没有保证,那么我们更倾向于采用 MJPEG 标准,因为某帧的丢失或延迟不会影响其它帧。而对于 ME 方法来说,某帧的延迟或丢失会导致整个 GOP 的延迟或丢失,因为只有获得前向参考帧 (previous reference frame) 才能对下一帧进行解码。
许多 VSIP 摄像头都有多个视频编码器,因此用户可根据具体应用要求选择最合适的视频编码器。某些摄像头甚至还能同时执行多种编解码器。MJPEG 对VSIP 摄像头的要求通常是最低的,几乎所有 VSIP 摄像头都可安装 JPEG 编码器。
MJPEG 标准的实施
在典型数字监视系统中,视频通过传感器采集、压缩,再以流媒体方式传输到视频服务器中。新型 DSP 架构上执行的视频编码器任务如果发生中断,就会出现问题,因为每次环境转换 (context switch) 都会导致大量寄存器存储和高速缓存释放。因此我们应采用异构架构,这样就能将 DSP 从视频采集和流媒体任务中解脱出来。以下结构图显示了视频监视应用中的 DSP/GPP 处理器架构实例。
相关延伸:视频 监视 视频编码器
随着人们安全意识的提高,视频监视系统日益普及,现已广泛应用于机场、银行、公共交通中心乃至私人住宅中。但传统模拟系统存在诸多问题,这促使人们希望转而采用数字系统。此外,随着计算机网络、半导体及视频压缩技术的日益推广,新一代视频监视系统将无疑采用数字技术,并将实行标准化技术,支持IP 网络。
就因特网协议视频监视系统 (VSIP) 而言,处理网络流量的硬件是摄像头系统的重要组成部分,因为视频信号要通过摄像头进行数字化、压缩处理,然后才传输到视频服务器,从而解决网络的带宽限制问题。DSP/GPP 等异构处理器架构有助于最大化系统性能。视频采集、存储和视频流都是中断密集型 (Interrupt intensive) 任务,我们可将其分配给 GPP 来处理,而高密度 MIPS 视频压缩工作则交给 DSP 去完成。数据传输给视频服务器后,服务器将压缩视频流作为文件存储在硬盘驱动器上,从而避免了像传统模拟存储设备那样出现视频质量下降问题。我们针对数字视频信号的压缩技术开发了多种标准,可分为以下两大类:
* 运动估算 (ME) 法:每 N 帧为一个图像组 (GOP)。我们对图像组中的第一帧进行独立编码,而对其它 (N-1) 帧来说,我们只将当前帧与其前面已编码的帧(即前向参考帧)的时差加以编码。常用的标准为 MPEG-2、MPEG-4、H.263 及 H.264。
* 静态影像压缩法:每个视频帧作为静态影像独立编码。最常用的标准为 JPEG。MJPEG 标准采用 JPEG 算法对每个帧进行编码。
运动估算法与静态影像压缩法的比较
显示了 H.264 编码器的结构图,与其它 ME 视频编码标准类似,H.264 编码器将输入影像分为多个16 x 16 像素的宏块 (MB) ,然后逐块处理。H.264 编码器包括正向路径和重构路径。正向路径将帧编码为比特位;重构路径从编码位中产生一个参考帧。下图中的 IDCT、IQ、 ME 和 MC分别代表(反向)离散余弦变换、(反向)量化、运动估算及运动补偿。
在正向路径中(从 DCT至 Q),每个宏块 (MB) 均可以帧内模式或帧间模式编码。在帧间模式下,运动估算 (ME) 模块将参考 MB 位于前面已编码的帧处;而在帧内模式下,参考MB 在当前帧中由采样形成。
重构路径 (从 IQ 至 IDCT)的目的是确保编码器和解码器采用相同的参考帧生成影像。否则就会累积编码器与解码器间的误差。
给出了 JPEG 编码器结构图。该编码器将输入影像分为多个 8x8 像素的模块,然后逐个处理。每个模块首先通过 DCT 模块,随后量化器根据量化矩阵对 DCT 系数进行取整。在此过程中,编码质量与压缩比均可根据量化步骤调节。最后熵编码器对量化器输出进行编码,并生成 JPEG 影像。
由于连续视频帧通常包括大量相关信息,因此 ME 方法可实现更高的压缩比。举例来说,就每秒 30 帧的标准 NTSC 分辨率而言,H.264 编码器能以 2 mbps 的速度进行视频编码,从而实现了平均压缩比高达 60:1 的影像质量。在影像质量相同的情况下,MJPEG 的压缩比则为10:1 至 15:1。
MJPEG 相对于 ME 方法有如下几点优势。首先,JPEG 需要的计算量和功耗相对大幅降低。此外,大多数PC 都配置了 JPEG 影像专用的解码及显示软件。如果记录特定事件只需一幅或几幅影像,比如人通过门口,那么 MJPEG 的效率会更高。如果网络带宽没有保证,那么我们更倾向于采用 MJPEG 标准,因为某帧的丢失或延迟不会影响其它帧。而对于 ME 方法来说,某帧的延迟或丢失会导致整个 GOP 的延迟或丢失,因为只有获得前向参考帧 (previous reference frame) 才能对下一帧进行解码。
许多 VSIP 摄像头都有多个视频编码器,因此用户可根据具体应用要求选择最合适的视频编码器。某些摄像头甚至还能同时执行多种编解码器。MJPEG 对VSIP 摄像头的要求通常是最低的,几乎所有 VSIP 摄像头都可安装 JPEG 编码器。
MJPEG 标准的实施
在典型数字监视系统中,视频通过传感器采集、压缩,再以流媒体方式传输到视频服务器中。新型 DSP 架构上执行的视频编码器任务如果发生中断,就会出现问题,因为每次环境转换 (context switch) 都会导致大量寄存器存储和高速缓存释放。因此我们应采用异构架构,这样就能将 DSP 从视频采集和流媒体任务中解脱出来。以下结构图显示了视频监视应用中的 DSP/GPP 处理器架构实例。
相关延伸:视频 监视 视频编码器