|
|
数字电视监控系统产品的压缩知识 |
目前,国内外各厂家纷纷推出不同的硬盘录像产品,分别有欧美厂家的以M-JPEG或H.261为主流压缩方式的硬盘录像系统,台湾的以MPEG-I方式压缩的产品、国内OEM日本韩国的泊来品、以及国内自己开发的录像产品等。其中不乏高性能价格比的好产品,但也有部分产品无过硬的技术指标和专业监控功能,却在产品的表面指标上大做文章,给消费者以误导。 硬盘录像系统是高技术含量产品,衡量一个硬盘录像系统的优劣需从以下几个角度入手: 压缩算法 目前硬盘录像常见压缩算法主要有MJPEG、MPEG、H。261等,下面就这几种方式作一比较。 MJPEG是一种简单的帧内JPEG压缩,虽然没有马赛克现象,但由于这种方式本身的技术限制无法作大比例压缩,录像每小时1-2G空间,网络传输,都将耗费大量的硬盘和带宽,除非有监控专网,否则不适合银行的联网监视及录像。MJPEG硬件支持不广泛,所以设备的维修和升级都以保证。 H.261是一种基于前后帧预测的帧内压缩算法,由于只预测了后1帧,所以在延时速度上比较有优势,可以做到比较小的延时,但在图像质量上却难以做到很高的清晰度,在录像上更无优势,无法做到大压缩比和变速率录像等。 MPEG-I是前后帧多帧预测的压缩算法,具有很大的压缩灵活性,能在底到256K的速率下压缩实时视频,能变速率压缩(动态侦测)最大的节省了存储空间,所以视不同的录像环境录像空间从80M/小时-400M/小时不等,并能根据不同的场合需要设置不同的压缩质量,是当前硬盘录像的首选。 是否具有监控功能 硬盘录像是银行取证的利器,但如果录像系统仅仅只是录像,那其灵活性将大打折扣,专业的硬盘录像主机应至少具备报警输入输出和多种云台控制功能,这样在发生事故时录像可自动启动并控制摄像机到预定的位置进行录像。如果具备矩阵控制功能那将使硬盘录像的功能最充分的发挥,可实现网络远程监视控制和录像。 对声音的支持 如果"只见其人,不闻其声",那录像系统只是对用户的敷衍,没有任何理由让银行的录像没有声音,如何在多路录像的同时能将声音保存并同步回放?这一直是这个行业的难题,目前市场上能解决带声音同步录像的产品不多,而能解决多路声音同时同步录像的更是凤毛麟角。目前推出的DEITECH系列硬盘录像主机具有16路声音同步录像的功能,其他韩国的部分产品由于受国外芯片技术的限制,只能录8路音频。一些早期的产品甚至不具备声音的支持或只能靠计算机声卡保留一路声音,还有一些厂商将多路声音通过混音设备混合成一路声音,用最不专业的方法解决最专业的需求! 网络的支持 远程进行录像是一个新发展出的录像方式,这种方式能保证录像的东西不会被破坏。高明的犯罪分子不会留下任何蛛丝马迹,可是谁又能知道,所有的作案过程都已经通过网络送往远程并被保存了呢?所以远程录像功能将被广泛应用于联网监视的金融安全系统中。 稳定性的考证 目前,部分厂家由于自身的无法解决技术上的难题,无法保证系统的长时间连续正常运行,所以采用人为控制系统定时重新启动,这虽然几乎不影响系统的正常运行,只是在启动期间无法录像,但在安全上确实是一个漏洞,也许关键的一刻就在重新启动期间发生。所以用该方法获取稳定的保障是不可取的。 价格因素 要看价格就需要看成本,从产品的来源来看,目前市场上有三种类型硬盘录像产品:①直接引用国外整机或挂国内品牌的OEM产品,②国内厂家采用国外录像板卡组装的二次开发产品,③国内厂家自己开发的板卡和应用软件,如果从成本上看应该是①>②>③,所以价格亦然,所以在技术含量均等的前提下,性能价格比最高的应该是国内厂家自己开发的产品,并且由于所有的技术内核是自己开发的,在维护维修周期及零件更新上都有其他产品无可比拟的优势。 二、MPEG4视频技术: 为了加速多媒体通信的发展,实现电信、计算机、广播电视这三大网络的最终融合,MPEG专家组继成功定义了MPEG-1和MPEG-2之后,于1994年开始制定全新的MPEG-4标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在多媒体通信及应用环境提供标准的算法及工具,用于实现音视频(audio-visual)数据的有效编码及更为灵活的存取。作为MPEG-4标准的核心内容,MPEG-4的视频编码部分正越来越多的受到关注,电子工业、广播电视业、电信业、计算机软件业都在紧密注视着它的发展。我国未来的图像通信、电视广播若要很好地与国际接轨,就必须抓住时机,对MPEG-4中的视频编码进行分析和研究。下面对MPEG-4视频编码技术的功能及特点进行讨论和分析。 (一)MPEG-4视频编码功能与特点 为了支持众多的多媒体应用,MPEG-4不仅保留了现有标准中的一些解决方案,而且致力于一些新功能的研究与定义。这些新功能包括可化分为三大类: 1、基于内容的交互功能: 基于对象的多媒体存取工具 基于对象的码率控制和编辑功能(提供编辑视频对象的方法) 基于对象的时域随机存取 2、数据压缩编码: 视频数据的高效编码 多个并发数据的有效编码 3、通用存取功能: 易错环境下的鲁棒性 基于内容的伸缩性(表现在时域、空间及重建图像质量上) MPEG-4的视频编码部分为了实现这些丰富多彩的多媒体应用,以算法和工具的形式为下列功能的实现提供了解决方案:1)图像和视频的有效压缩;2)2D和3D网格纹理映射图(用于合成图像编码)的有效压缩;3)隐含(implicit)的2D网格的有效压缩;4)控制网络运动的节点时变几何数据流的有效压缩;5)各种视频对象的有效存取;6)对图像和视频序列的扩展操纵;7)基于内容的图像和视频编码;8)纹理、图像和视频基于内容的伸缩性;9)视频序列中时域、空间及质量的伸缩性;10)易错环境下的鲁棒性。 上述的这些功能大部分与基于内容的创作、发布和存取有关。此外,MPEG-4对合成视频对象的支持同样引人注目:MPEG-4可对合成的面部与人体进行参数化描述;对面部与身体活动信息以参数化的数据流进行描述;支持具有纹理映射功能的静态/动态网络编码;支持视点有关应用(View Dependent Application)中的纹理编码。 MPEG-4视频编码标准将支持MPEG-1、MPEG-2中的大多数功能,提供不同视频标准源格式、码率、帧频下矩形图像的有效编码,同时也将支持基于内容的图像编码。 在这一功能集的底层是VLBV核心(VLBV:VeryLowBitRate Video)。它为5-64kbits/s视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352×288像素)和较低的帧频(低于15Hz)。 VLBV核心支持的专用功能包括:(a)实时多媒体应用:支持矩形图像序列的有效编码,具有编码高效率、高精度、高容错度、低延时等特点。(b)多媒体数据应用:支持多媒体数据库的存储、随机存取以及FF/FR(快进/快退)等功能与操作。 MPEG-4的HBV(HBV:High Bit Rate Video,范围在64kbits/s-4Mbits/s之间)同样支持上述功能,但它支持较高的空间与时间分辨率。其输入可以是ITU-R601的标准信号,因此其典型应用为数字电视广播与交互式检索。未来的多媒体应用呼唤全新的交互方式,以满足用户的需求。传统的交互存取方式中,用户得到的场景是制作人员事先编排好的,用户只能对音视频序列进行简单的回放。MPGE-4提出了基于内容(Content-based)的存取概念,努力使用户根据制作者设计的具体自由度与场景进行交互。用户不仅可以改变场景的视角在其中尽情畅游,还可以改变场景中物体的位置、大小和形状或对该对象进行置换甚至清除。用户将这些简便、灵活的交互过程中获得的丰富的信息和极大的乐趣。 (二)、从矩形帧到VOP(Video Object Plane:视频对象面) 传统图像编码方法依据信号源编码理论的框架,将图像作为随机信号,利用其随机特性来达到压缩的目的。这种方法本身未能考虑信息获取者的主观意义与主观特性,未能考虑事件本身的特性具体含义、重要性以及后果等等。但正是由于信源编码理论的限定使得传统的图像编码具有较高的概括性和综合性,而基于矩形帧编码的传统视频编码标准如H.261、MPGE-1/ MPGE-2在实际应用中也获得了巨大成功。然而MPGE-4并不满足于此,它的目标在于采用现代图像编码方法,利用人眼的视觉特性,抓住图像信息传输的本质,从轮廓一纹理的思路出发,支持基于视觉内容的交互功能。而实现基于内容交互功能的关键在于基于视频对象的编码,为此MPGE-4引入了视频对象面VOP的概念。在这一概念中,我们根据人眼感兴趣的一些特性如形状、运动、纹理等,将图像序列中每一帧中的场景,看成是由不同视频对象面VOP(Video Object Plane)所组成,而同一对象连续的VOP笔名为视频对象VO(Video Object)。VO可以是视频序列中的人物或具体的景物,例如电视新闻中的播音员,或是电视剧中一辆奔驰的汽车;也可以是计算机图形技术生成的二维或三维图形。 对于输入视频序列,通过分析可将其分割为n个VO(n=1,2,3…),对同一VO编码后形成VOP数据流。VOP的编码包括对运动(采用运动预测方法)及纹理(采用变换编码方法)的编码,其基本原理与H.261、MPGE-1/ MPGE-2极为相似。由MPGE-4基于内容图像编码方法VOP具有任意形状,因此要求编码方案可以处理形状(Shape)和透明(Transparency)信息,这同只能处理矩形帧序列的现有视频编码标准形成了标准形成了鲜明的对照。在MPGE-4中,矩形帧被认为是VOP的一个特例,这时编码系统不同处理开头信息,退化为类似于H.261、MPGE-1/ MPGE-2的传统编码系统,同时也实现了与现有标准的兼容。从矩形帧到VOP,MPEG-4顺应了现代图像压缩编码的发展潮流,即从基于像素的传统编码向基于对象和内容的现代编码的转变。从这个意义上讲,MPEG-4视频编码技术翻开了图像编码史上崭新的一页。 (三)基于VOP的视频编码 MPEG-4编码器由两个主要部分组成:形状编码和纹理、运动信息编码。其中纹理编码、运动预和运动补偿部分在原理上同现有标准是一致的。值得注意的是开头编码,这是图像码标准中第一次引入形状编码技术,为了支持基于内容的功能,编码器可对图像序列中具有任意形状的VOP进行编码。尽管如此,编码器内的机制都是基于16×16像素宏快(Macroblock)来设计的,这不仅是出于与现有标准在兼容问题上的考虑,而且是为了便于对编码器进行更好的扩展。VOP被限定在一个矩形窗口内,称之为VOP窗口(VOP Window),窗口的长、宽均为16的整数倍,同时保证VOP窗口非VOP的宏块数目最少。标准的矩形帧可认为是VOP的特例,在编码过程中其形状编码模块可以被屏蔽。系统依据不同的应用场合,对各种形状的VOP输入序列采用固定的或可变的帧频。 编码算法仍是基于块(8×8像素)的预测-变换混合编码。对VOP的编码采用帧内(Intra)编码与帧间预测编码相结合的方法,帧内编码中对DCT变换的DC、AC因子进行有效的预测。帧间预测分为前向预测和双向预测。对于甚低码率(<64kbits/s)下的应用,由于方块效应较明显,所以需用除方块滤波器进行相应处理。 MPEG-4引入了形状信息的编码,尽管形状编码在计算机图形学、计算机视觉和图像压缩领域不是什么新技术,但将其纳入完整的视频编码标准内,这还是第一次。VO的形状信息有两类:二值形状信息和灰度形状信息。实验表明,位图表示法具有较高的编码效率和较低的运算复杂度。但为了能够进行更有效的操作和压缩,在最终的标准中可能出现另一种表示方法,即借用高层语义的描述,以轮廓的几何参数进行表征。 3.2运动信息编码 类似于现有的视频编码标准,MPEG-4采用运动预测和运动补偿技术来去除图像信息中的时间冗余成分,而这些运动信息的编码技术可视为现有标准由向任意形状的VOP的延伸。VOP的编码有3种模式:帧内(Intra-frame)编码模式(I-VOP)、帧间(Inter-frame)预测编码模式(P-VOP)、帧间双向(Bidirectionally)预测编码模式(B-VOP)。在MPEG-4中运动预测和运动补偿可以是基于16×16像素宏块的,也可以是基于8×8像素块的。为了能适应任意形状的VOP,MPEG-4引入了图像填充(IMAGE padding)技术和多边形匹配(Polygon Matching)技术。图像填充技术利用VOP内部的像素值来外推VOP外的像素值,以此获得运动预测的参考值。多边形匹配技术则将VOP的轮廓宏块的活跃部分包含在多边形之内,以此来增加运动估值的有效性。 3.3纹理编码 纹理编码的对象可以是帧内编码模式的I-VOP,也可以是帧间编码模式B-VOP或P-VOP运动补偿后的预测误差。编码方法基本上仍采用基于8×8像素块的DCT京城 帧内编码模式中,对于完全位于VOP内的像素块,则采用经典的DCT方法;对于完全位于VOP之外的像素块则不进行编码;对于部分在VOP内,部分在VOP外的像素块则首先采用图像填充技术来获取VOP之外的像素值,之后再进行DCT编码。帧内编码模式中还将对DCT变换的DC及AC因子进行有效的预测。在帧间编码模式中,为了对B-VOP和P-VOP运动补偿后的预测误差进行编码,变换之后的DCT因子还需过量化(采用单一量化因子或量化矩阵)、扫描及变长编码,这些过程与现有的压缩视频标准基本相同。 3.4分级编码 很多多媒体应用需要系统支持时域、空间及质量的伸缩性,分级编码就是为了实现这一目标。便如,在远程多媒体数据库检索及视频内容重放等应用中,分级编码的引入使得接收机可依据具体的信道带宽、系统处理能力、显示能力及用户需求进行多分辨率的解码及回放。接收机可视具体情况对编码数据流进行部分解码,以获得较低的解码复杂度,同时也意味着较低的重建图像质量、较低的空间分辨率、较低的时间分辨率,即帧率。相同空间分辨率及帧率条件下,较低的重建图像质量MPEG-4中通过视频对象层VOL(Video Object Layer)的数据结构来实现分析编码。 全新的视频重建和复合: 这些功能无疑会加速多媒体应用的发展,而从中受益的应用领域有: 因特网多媒体应用 交互式视频游戏 实时可视通信,包括可视电话、实时通信等 交互式存储媒体应用,如CD-ROM、DVD等 广播电视 演播室技术及电视后期制作 采用面部动夯技术的虚拟会议 多媒体邮件 移动通信条件下的多媒体应用 远程视频监控 通过ATM网络等进行的远程数据库业务 |
|
|
|
|
| |
|
|
|
|
|
|
|
|