您现在的位置: 公文易 >> 免费论文 >> 计算机论文 >> 论文正文 >> MPEG-4技术及应用综述
归档:计算机论文 推荐度:
日期:2006-2-24 18:15:00

MPEG-4技术及应用综述

字体大小:
MPEG-4技术及应用综述
得以实现。DMIF规格提供了在几个新网络类型,例如Internet上实现该任务的线索。
  DAI也用来访问广播介质和本地文件,这意味着在多传输技术上定义访问多媒体内容的单一、统一的接口 。
  因此,我们适合这样说,DMIF的集成框架涵盖了三种主要技术,交互网络技术、广播技术和磁盘技术。DMIF如此以至依赖于DMIF通信的应用不必关心底层的通信方法。DMIF执行以处理关于简单应用接口的传输技术细节。应用通过DMIF应用接口访问数据,无论该数据来自广播源、本地存储器或远端服务器。在所有的情况下本地应用只通过统一接口(DAI)交互。不同的DMIF实例考虑到采用传输技术的特性把本地应用翻译为送至远端应用的特定消息。类似地,(从远端服务器、广播网络或消息。类似地,(从远端服务器、广播网络或本地文件)进入终端的数据通过DAI统一地传给本地应用。不同的、特定的DMIF实例被管理各种特定传输技术的应用唤醒,虽然这对于应用是通明的,它只是和单一的"DMIF过滤器"交互。该过滤器负责为特定DAI向正确的实例粗定向。DMIF不规定该机制,只假设它是运行的。这在该图的阴影框内有所强调,目的是澄清DMIF应用的边界,此时DMIF通信构架定义了若干模块,实际的DMIF应用只需要在边界上保持他们的表现。这样,通过例如基于IP的或ATM的网络访问的"真实的"远程应用,和从广播源或磁盘获取内容的模拟远端制造者应用。然而在前一种情况中,两实体间交换的信息必须规范定义以确保互操作性。在后一种情况中,两个DMIF实体间的接口和模拟远端应用在单一实现中不需考虑该规范。对于广播和本地存储,该图展示了一条"本地DMIF、远端DMIF(模拟)、远端应用(模拟)"的链条。该链条只表达概念化模型而不需对应为实际实现(全部在阴影区内)。
  DMIF构架考虑广播和本地存储时,假设模拟远端应用了解数据如何发送和存储。如何可以得到处理中的应用种类的信息。对于MPEG-4,这实际就是如基本流ID、首对象描述符、服务名之类的概念。虽然DMIF层理论上不了解正提供支持的应用,由于(模拟)远端应用的存在,对广播和本地存储等特殊情况该概念并不完全正确 。因为(模拟)远端应用不了解数据是如何传送/存储的,对于这样的DMIF应用数据传送/存储的细致描述是无意义的。
  而当考虑远端交互时,DMIF层是完全不了解应用的。引入附加接口-DMIF网络接口(DNI )以确定DMIF对需要交换何种信息。该附加模块负责把DNI原语映射为特定网络使用的消息。应当注意DNI原语只是为信息目的所指定,并不需要在实际应用中表现DNI接口。为了支持相同的终端多传输技术甚至多场景(广播、本地存储器、远端交互),DMIF支持允许一个或多个DMIF实例同时出现,每个面对特定的传输技术。多传输技术可被相同应用激活,这样就能够管理被广播网络、本地文件系统和远端交互点传送的数据。

[NextPage]

2.3.2 流数据的多路复用,同步和描述

  必须要在传输层从网络连接或存储设备来的数据中获得各基本流。在MPEG-4系统模型中每个网络连接或文件被单独看成一个TransMux通道。依应用而异复用部分或完全地作用于MPEG-4范围之外的层。MPEG-4唯一定义的复用工具是FlexMux工具,它对于低延迟、低负载复用及为节省网络连接资源来说是可选的。
  为了在系统环境中集成MPEG-4的目的,DMIF应用接口成为可作为同步层--打包流访问的基本流的参考点。DMIF网络接口确定了同步层-打包流-无FlexMux或FlexMux流如何从TransMux层得到的。这就是不被MPEG定义的传输功能的接口。这里考虑接口的数据部分,控制部分由DMIF处理。
  与MPEG-1和MPEG-2以位流语法和语意描述理想解码设备的方式相同,MPEG-4定义了系统解码模型。这就允许不做非必要假设和精确细节准确定义终端操作。这对于以不同方式自由地实现设计真实MPEG-4终端和解码设备是必要的。这些设备包括从不能与发端通信的电视接收机到能完全双向交互的计算机。一些设备通过同步网络MPEG-4流,另一些通过非同步方式(例如Internet)交换MPEG-4信息。系统编码模块提供所有MPEG-4终端应用基于的通用模块。确定缓冲和延迟模型对不知道如何接收编码流的编码设备是必要的。虽然MPEG-4使编码设备可通知资源需求的解码设备,如前所述,该设备也可能不响应发端。同样有可能一个MPEG-4会话同时接受不同设备的信息。但这将根据设备的容量来进行。

2.3.3 语法描述

  MPEG-4定义了一种语法描述语言来描述位流传送媒体对象和景象描述信息位流的精确位语法。该语言从C语言出发,是C++语言的扩展,用来以综合方式描述对象的句法表达、所有媒体对象的类定义和景象描述信息。这提供了精确地恒定统一描述语法的方式,同时简化位流依从测试。软件工具可用来进行语法描述,产生进行判定的程序的必要代码。

2.3.4音频对象编码

  MPEG-4音频对象编码为表达自然声音(例如话音和音乐)和基于机构化描述的合成声音都提供工具。合成声音的表达可从文本数据或所谓的结构描述,以编码参数提供反射、空间定向等效果的方式实现。该方式提供压缩和其他例如可伸缩性和效果处理等其他功能。覆盖6kbit/s到24kbit/s速率的MPEG-4语音编码工具已和NADIB合作通过AM数字语音广播 应用检验性测试。为辩识合适的数字语音广播格式以改进现有的AM模式服务,包括MPEG-4 CELP、TwinVQ、和AAC工具一些编码设置与一个参考AM系统进行了比较。发现数字技术可在同样带宽上实现更高质量,而且编码设置提供了优于联播的效果。MPEG还进行了附加检验测试,把话音和普通语音编码的工具与现存标准进行比较。

2.3.5 视频对象(VO)编码

  为了支持基于内容的交互性,即支持对内容(场景中的物理对象)独立地进行编解码,MPE G-4视频检验模型(即发展完善中的视频编码算法和工具集)引入了视频对象面(VOP)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象(VO)。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOL)。除此之外,辨别各个视频对象层,以及接收端合成不同的视频对象层以重建完整的原序列所需的相关信息也包含在比特流中。这使得可以对每个VOP独立地进行编解码,且可以对视频序列进行灵活操作。输入进行编码的源视频对象序列可以是独立实体,也可以由在线或脱线的分割算法产生。
  有些多媒体业务需要提供面向对象的操作和编辑功能,如远程数据库访问、视频编辑等。 有些情况下,人们只对场景中的某个对象感兴趣,如多媒体会议,人们感兴趣的只是与会者的头肩像,而不关心背景。因此,为了节省带宽,可以只传送头肩像的视频信息,接收端再把收到的头肩像信息解码重建,并置于一间虚拟会议室中。基于内容的视频编码系统可以在比特流层支持这种基于对象的访问和操作功能。
  有两种类型的视频编码系统支持基于内容的交互性,一种是模型基编码;另一种是在传统 的基于块的视频编码系统的基础上扩充而成的。对于前者,在此不做讨论。而后者则是传统的,基于块的混合运动预测/补尝编码系统扩展到任意形状的视频序列而成的。传统的、基于块的编码方法已被MPEG-1/2和H.261/3等标准所采用。这种系统主要由场景分析和对象分割、形状编码、运动编码、纹理编码等模块构成,具体的编码算法则做为实现系统中各个功能模块的工具,可根据实际需要选取组合。首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息。VOP的形状和位置信息可以用上文提到的alpha平面来表示。发送端只需传送alpha平面,接收端就可以确定VOP的形状和位置。alpha平面所需的比特数是比较多的,需要进行压缩编码。显然,只要对VOP

上一页  [1] [2] [3] [4] [5] 下一页




推荐文章

我得网服务大全:适时新闻 | 秘书资讯 | 专题文档 | 实用查询 | 新华字典,词典 | 成语词典 | 全唐诗 | 歇后语大全
关于我们 | 版权与隐私 | 爱心救助 | 加入会员 | 网站地图 | !报告错误 | 联系方式
公文易爱心文秘网,我得网 © 2003-2009