搜档网
当前位置:搜档网 › 视频音频基本知识

视频音频基本知识

标清 高清 全高清
点击数: 17886 2008-2-15 11:28:12
所谓标清,是物理分辨率在720p以下的一种视频格式。720p是指视频的垂直分辨率为720线逐行扫描。具体的说,是指分辨率在400线左右的VCD、DVD、电视节目等“标清”视频格式,即标准清晰度。而物理分辨率达到720p以上则称作为高清,(英文表述High Definition)简称HD。关于高清的标准,国际上公认的有两条:视频垂直分辨率超过720p或1080i;视频宽纵比为16:9。
对于“高清”和“标清”的划分首先来自于所能看到的视频效果。由于图像质量和信道传输所占的带宽不同,使得数字电视信号分为HDTV(高清晰度电视)、SDTV(标准清晰度电视)和LDTV(普通清晰度电视)。从视觉效果来看HDTV的规格最高,其图像质量可达到或接近35mm宽银幕电影的水平,它要求视频内容和显示设备水平分辨率达到1000线以上,分辨率最高可达1920×1080。从画质来看,由于高清的分辨率基本上相当于传统模拟电视的4倍,画面清晰度、色彩还原度都要远胜过传统电视。而16:9的宽屏显示也带来更宽广的视觉享受。从音频效果看,高清电视节目将支持杜比5.1声道环绕声,而高清影片节目将支持杜比5.1 True HD规格,这将给我们带来超震撼的听觉享受。
HD FULL 全高清
所谓全高清(FULL HD),是指物理分辨率高达1920×1080显示(包括1080i和1080P),其中i(interlace)是指隔行扫描;P(Progressive)代表逐行扫描,这两者在画面的精细度上有着很大的差别,1080P的画质要胜过1080i。对应地把720称为标准高清。很显然,由于在传输的过程中数据信息更加丰富,所以1080在分辨率上更有优势,尤其在大屏幕电视方面,1080能确保更清晰的画质。
4CIF(704×576)或CIF(352×288)的标清视频格式过渡到1080P(1920×1280)或720P(1280×720)的高清视频格式

什么是高清

高清,英文为“High Definition”,意思是“高分辨率”。一般所说的高清,有四个含义:高清电视,高清设备,高清格式,高清电影。

高清电视

高清电视,又叫“HDTV”,是由美国电影电视工程师协会确定的高清晰度电视标准格式。一般所说的高清,代指最多的就是高清电视了。电视的清晰度,是以水平扫描线数作为计量的。以下是几种常见的电视扫描格式:

D1为480i格式,和NTSC模拟电视清晰度相同,525条垂直扫描线,483条可见垂直扫描线,4:3 或16:9,隔行/60Hz,行频为15.25KHz。

D2为480P格式,和逐行扫描DVD规格相同,525条垂直扫描线,480条可见垂直扫描线,4:3 或 16:9,分辨率为640×480,逐行/60Hz,行频为31.5KHz。

D3为1080i格式,是标准数字电视显示模式,1125条垂直扫描线,1

080条可见垂直扫描线,16:9,分辨率为1920×1080,隔行/60Hz,行频为33.75KHz。

D4为 720p格式,是标准数字电视显示模式,750条垂直扫描线,720条可见垂直扫描线,16:9,分辨率为1280×720,逐行/60Hz,行频为45KHz。

D5为1080p格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080逐行扫描,专业格式。

此外还有576i,是标准的PAL电视显示模式,625条垂直扫描线,576条可见垂直扫描线,4:3或16:9,隔行/50Hz,记为576i或625i。

高清电视,就是指支持1080i、720P和1080P的电视标准。现在的大屏幕液晶电视机,一般都支持1080i和720P,而一些俗称的“全高清”(Full HD),则是指支持1080P输出的电视机。目前的高清电视数字信号,最高支持720P,还没有能够支持1080P的。


高清设备

对于DVD播放机、摄像机、投影仪和显示器等显示设备来说,所谓的“高清”,一般就不仅仅是“720P”了,而是指“全高清”,也就是支持1920*1080分辨率的视频输出。这些设备,通常价格昂贵。

高清格式

由于高清视频数据传输量巨大,所以需要有新的压缩算法。现在的高清视频格式,主要有:H.264、WMA-HD、MPEG2-TS、MPEG4和VC-1等。其中,H.264格式目前最为流行。所以,再购买高清碟机或者显卡的时候,一定搞清楚,设备是否支持H.264。比如Nvidia的8400G显卡就不支持H.264,而8400GS则支持。

高清电影

所谓的高清电影,就是指以高清视频格式制作的全高清(1920*1080)视频文件。比如蓝光DVD的视频文件,就是以h.264格式压缩的。现在的高清视频播放,通常是通过计算机进行。由于高清视频文件的算法复杂,计算量巨大,所以对CPU和显卡有比较高的要求。通常情况下,一台播放高清视频的电脑,必须配备内置了硬件高清解码功能的显卡,因为完全的软解压对CPU的要求太高了。













分辨率
点击数: 3022 2008-2-15 11:28:12
分辨率(Resolution) - 影象清晰度或浓度的度量标准。举例来说,分辨率代表垂直及水平显示的每英寸点(dpi)的数量。BitWare 可以用普通或标准(100 乘 200 dpi)及精细分辨率(200 乘 200 dpi)发送及接收传真文档。
分辨率是一个表示平面图像精细程度的概念,通常它是以横向和纵向点的数量来衡量的,表示成水平点数×垂直点数的形式。在一个固定的平面内,分辨率越高,意味着可使用的点数越多,图像越细致。
显示分辨率
显示分辨率是平板电视在显示图像时的分辨率,分辨率是用点来衡量的,显示器上这个“点”就是指像素(pixel)。显示分辨率的数值是指整个显示器所有可视

面积上水平像素和垂直像素的数量。例如1366×768的分辨率,是指在整个屏幕上水平显示800个像素,垂直显示600个像素。显示分辨率的水平像素和垂直像素的总数总是成一定比例的,最常见的为16:9。传统CRT电视所支持的分辨率较有弹性,而液晶电视的像素间距已经固定,所以支持的显示模式不像CRT电视那么多。液晶电视的最佳分辨率,也叫最大分辨率,在该分辨率下,液晶电视才能显现最佳影像。
液晶电视呈现分辨率较低的显示模式时,有两种方式进行显示。第一种为居中显示:例如在XGA 1024×768的屏幕上显示SVGA 800×600的画面时,只有屏幕居中的800×600个像素被呈现出来,其它没有被呈现出来的像素则维持黑暗。目前该方法较少采用。另一种称为扩展显示:在显示低于最佳分辨率的画面时,各像素点通过差动算法扩充到相邻像素点显示,从而使整个画面被充满。这样也使画面失去原来的清晰度和真实的色彩。
目前平板电视的分辨率主要有1366×768和1920×1080等几种,随着新品的不断涌现,分辨率也在提高中。








数字视频标准
虽然,早期基于复合信号(NTSC 或PAL)取样的数字技术方面取得了许多经验,然而人们终于认识到.为了获得最好的质量效果。还是必需采用分量的处理方式,第一个数字标准是分量标准,自从安培公司和索尼公司宣布了复合数字录像格式,就是后来的D-2格式,重新引起了从们对复合数字录像格式的举。最初,这些录像机设计为模拟输入输出的设备.提供在现有模拟的N议 和PAl‘环境下使用,利字输入 和输出只是作为机对帆复制 时使用;然而,后期制作部门 发现,如果在全数字的环境下 使用,利用这些机器的多代复 制性能,可以取得更大的效益。

REC 601。建议书ITU—RBT601 (原先的CCIR建议书601)不是 一种取样视频接口标准,而是 一种取样标准。REC 601是 SMPTE和EBU联合制定的,规 定了525/59.94和625/50电视系 统中数字分量视频信号的参 数规定。1981年SMPTE进行了 一系列关键性的研究工作,结 果得出了众所周知的CCIR 601 推荐书。这个文件规定厂适用于525行和625行信号的取样方 案。其中规定:亮度信号的正交取样频率为13.5MHZ两个色 差信号Cb和Cr,的取样频率为 6.75MHz:Cb,Cr,与B—Y,R—Y之 间有确定的比例关系: 这种取样结构又称为”4:2:2”。 这个术语的来出是:早期把取样频率设定为NTSC副载频的若干整倍数。后来,这个设想被放弃了。但是用4来表示亮 度信号的取样频率却保留下 来了。SMPTE/EBU工作小组详 细考察厂从12MHz到14.3范围内的亮度取样频率,如果选定 13.5MHz作为折中方案,这是因

为2,25MHz是625行和525行系 统的公共整倍数。现在与取样 系统有关的全部论述都是假 定以4=13.5MHz为基础。也就 是说,取样基频是3。375MHz。 某些扩展清晰度电视系统使用了一种分解力更高的格式, 称为”8:4:4”视频取样,其带宽 是4:2:2的两倍。

并行分量数字标准

REC 601 阐述了信号的取样。SMPTE和 EBU分别制定厂适合于该取样 的数据电信号接口规定。MPTE 制定厂525/59.94并行接口规 定,称为SMPTE标准125M,(早 期的RP—125版本),而EBUTEch 3267则规定厂625/50接口(较早期的EBU TEch 3246版本)。 两者都力CCIR所接受,并收入推荐书656。这个文件定义了硬件接口。 并行接口使用11股绞线,25芯D型连接器。(早期文件规定, 连接器采用滑扣锁定方式。后 来,文件修改为使用4/40螺丝 固定方式)。这种接口按照Cb’, Y,Cr’。Y,Cb”的顺序,将多路 数据字组合起来,发送出去。传 送数据率是27M字/秒。在每条 线上都叠加定时时序SAV和 EAV,以表示有效视频的起始 点和终点。有效数字行内包含 720个亮度取样。在有效行中 包含了表示行消隐的区间。

REC 601规定、表示视频信号的数据字的精度是8比特,在制定标准时,就有人曾经提出这个精度可能不够,应将接口精度扩展到10比特。事实证明, 在许多情况下,10比特精度确实带来好处。因此最新版本的 接口标准为10比特。然而,也同时使用8比特的标准。选择数—模变换器工作范围时,在峰值白电平以上和黑电平以下 分别留有余量。如图2—5所示

黑电平与白电平的量化是在8 位的基础上加上两个”0”,这样 就得到厂等于10位的量化级。 数值000—003和3FF—3FC保留给同步使用。对于色差信号的量 化,也采取了类似的规定。如图2—6所示。

图2—7所示是取样位置与数字字相对于模拟水平行的位置关系,由于EAV和SAV代表了定时信息,因此没有必要传送通常的同步信号,行消隐区( 也包含场消隐区中的行正程), 可以用于传送辅助数据。很显然,这个数据空间可以用来携带数字声音。SMPTE制定了一 个文件,声音数据包的格式和分配标准作了规定。

事实已经充分证明了REC 601/ 656广泛适合于制作与后期制 作设备的技术需要,一般来说, 在大型设备系统中,许多常用设备都能够代替并行接口的作用。REC 601综合了数字和分量格式应用的优点。选择该系统,可以获得525行和625行的最高质量。

并行复合数字系统

复合视 频信号以4倍(NTSC;或PAL) 副载波频率进行取样对于NTSC: 得到的标称取样频率是14, 3MHz,而PAL制为17.7MHz。 NTSC的接口标准是 SMPTE244M。在编写本文时, EBU正在制定关于PAL制的接口标准

。两种接口标准都规定为10比特的精度。虽然D2和D3 格式记录在磁带上的精度只有8比特,NTSC信号的量化规 定是(示如图2。8)100%彩条信 号最高幅度上部留有适当余量同步顶以下留有较小余量, 对于分量信号也具有类似的特征。 根据PAL复合数字信号的规 定,为了减小量化噪声,充分利用厂最大可用的数字范围,

由图2—9可知,峰值模拟信号的 值实际上已经超过厂数字的 动态范围,这样就有可能出现 错误。由于规定歹取样轴,副 载波和最高亮度条(如黄色条) 相位的基准,所以取样决不会 超出数字的动态范围。所包含 的数值如图2-10所示。

与分量接口—样,复合数字信 号的有效行中足以表示模拟 的有效行和模拟的消隐边沿信号,与分量接口不同的是,复 合接口发送的数字信号表示 的行消隐期间普通的同步和 色同步信号。在复合接口上,还 传送表示场同步和均衡脉冲 的数字信息。 复合数字设备具有数字处理 和接口的各种优点,九其是数 字录象的多代复制性能。然 而,也存在一些局限性。由于 是复合方式的信号就存在NTSC 和PAL编码方式的烙印,其中 包含这些编码方式所固有存 在的窄带色度信息的问题。例 如在色键这样——类处理中,往 往不能满足高质量制作的要 求,必须分离出分星信号,取得 健信号就必须进行分离处理。 在某些应用情况下,例如在数 字特技中,为了便于处理,要求 将信号解码成为分量倍?号,最 后再重新编码成为复合信今 此外、在8比特录象机中,复合 信号的满幅值表示成256级电平。总而言之,与模拟方式的 NTSC和PAL设备相比,复合数 字方式能够提供更加有效的 应用环境。对于许多用户来 说,花上这些代价还是值得的。 与分量数字方式——样,并行复 合接[1使用多芯电缆和25芯 “D”型连接器。实践证明,对于 /j1型和中型尺—寸的设备来说、 这样的用法是满意的。但对于 大型设备系统来说,还是滞要 使用串行接口。
























关于D1格式全带宽数字电视系统的测试
--- 广东电视台 邢卫东
一 D1格式全带宽数字电视信号及其产生
全带宽数字电视是指未经压缩的数字电视。D1格式是符合ITU-R BT601-2标准的全带宽数字分量电视信号格式。我们着重讨论625行的D1格式信号。
数字电视系统分别在Y、B-Y和R-Y上取样和量化就形成了全带宽的数字分量电视信号。按照ITU-R BT.601—2标准,D1格式的总取样频率为27MHz,其中分配给Y为13.5MHz、B-Y为6.75MHz、R-Y为6.75MHz。我们知道,从CCD摄像机输出的RGB模拟分量信号(30MHz带宽以上),在采用隔行扫描方式及[Y B-Y R-Y]矩阵线性变换后,其带宽大

致降至10MHz,其中亮度信号占了一半带宽。所以,D1格式的取样在反映这样一种信号结构上是合理的。D1格式信号最初采用8bit量化,后来修正为10bit量化,其并行输出码率为27Mb/s。当D1格式使用串行输出时,必须引入一个时钟频率是D/A转换时钟频率10倍(270MHz)的移位寄存器进行并、串转换,使寄存器的移位对应10bit数据的每一位,并且与并行信号保持相同的速率。D1格式的串行输出码率为270Mbit/s。
D1格式串行分量接口采用负极性的不归零变换编码(NRZI),从而使得数据流对极性不敏感,不管什么极性,只要有跳变,就可通过跳变来恢复信号。换句话说,信号的上升沿和下降沿均可用来表示信号,这样即便是全“1”的信号,进行NRZI后的信号频率也仅是时钟频率的一半。另外,在D1中,应用了扰码技术对串行流进行随机加扰,连“1”的信号几率减少,高频分量也就进一步减少。经过扰码的数据“0”、“1”分布更加均匀,用于线路传输还可以去除直流分量。
D1格式的串行信号不需要专门的时钟,时钟信号从串行数据中即可恢复。这就要保证串行数据有足够的上升沿和下降沿来满足时钟恢复的需求。
在实际应用中,数字电视系统通常以串行传输为主要手段。这主要是因为串行连接更方便、传输距离更远(标准同轴电缆中的可靠传输距离为200米)。
二 全带宽数字系统的一些重要特征
同模拟系统相比,全数字电视系统带来许多新的特征,也因此带来与模拟系统不同的测试要求。我们从几个方面来论述这些特征。
1 数字数据流及其误码
当模拟电视信号转换为数字信号后,我们考察数字串行系统,信号不再是类似模拟系统的载波信号。在全数字系统中,数字串行信号不再被调制到载波上传输,而是直接在基带上传输,直接表现为高低电平间的转换。
在合适的示波器上观察,高低电平间的跳变产生的波形类似于“眼睛”(这是多次扫描的路径由于示波管的余辉而重叠的结果)。当高、低电平之间的跳变幅度不够,或者波形沿时间轴的抖动过大,或者上升、下降沿因失真造成的畸变太严重时,都会造成“眼睛”闭合。这种类似于眼睛的波形图称为眼图。当眼图闭合时,系统可能不再能判断传输信号电平间的跳变,数字系统就会崩溃。
传输过程中数字电平的跳变错误称之为误码,系统崩溃是误码达到极限的一种反映。数字视频的误码具有两个重要特征:其一,它间隔出现,并形成在相同数据字上出现的误码群,其二,由于扰码的原因,单个比特误码也会影响到两个以上的取样值,且误码比特出现在数据字的最高位(MSE)或次高(MSE—1)位上并被发现

的机会达70%以上。一般而言,平均每场达到一次以上的误码是不可接受的。所以,可以用视频场为单位检查误码出现的状况,如果检测到视频场的校验错误即认为出现一次误码情形。如果用每秒节目中出现误码的次数来统计一个误码群,称之为误码秒。
2 数字电视系统对信号幅值有更严格的要求
全带宽的数字电视对信号的幅值有相当严格的规定,这是因为要将10bit的数据位合理地分配给要表示的信号内容。图4是D1格式信号的亮度和色度量化电平分配规定。可以看到,对亮度信号的黑电平(在“040h”)和白电平(在“3ACh”),以及在黑、白电平两端留出的幅值空余都有明确的表示,信号正向峰值不能超出766.3mv(用3FFh表示),负向峰值不能超过-51.1mv(用000h表示)。色差信号也对最正(350mv)和最负(一350mv)以及信号两端留出的空余做出了严格规定。除了信号本身,串行视频携带的一些数字数据(如4码字的定时数据“3FF000000XYZ”)也充分利用了对电平级的这些规定。
所以,在数字系统中,A/D或D/A单元对量化电平级的准确判别非常重要,否则将造成图像损伤。除了电平级的判别外,模拟系统和全带宽数字系统连接时,还会产生一些突出的问题。譬如当模拟信号的幅值超过上述规定峰值时,就不能用数字信号表示。这时,超过正向峰值的信号用“1111111111(3FFh)”表示,超过负向峰值的信号用“000h”表示。这会带来两种不同的问题。当连“1”的数据太长,即便经过扰码,数字信号中的高频分量也大大增加,不利于传输。当连“0”的数据太长,则对数字时钟的恢复带来困难。这两种情形都加重了对系统的性能要求。
3 模拟失真和数字失真
增益、相位和频率响应这些对于模拟系统非常敏感的问题,在数字电视系统中不再成为问题。一般来讲,利用数字方式进行分配时,信号会保持稳定的增益、相位和频率响应。这主要得益于,数字信号很容易自动地保持合适的均衡度,从均衡的串行信号中可完整地恢复数字信号。另外,数字信号在分配与切换过程中,足以在各种条件下保持信号的完整性,从而消除了群延时、行或场的时间畸变、微分增益和微分相位等失真积累问题。 值得注意的是,数字电视系统在消除这些模拟失真的同时,引入了一种数字失真,即量化误差。量化误差是高阶非线性失真的产物,其失真表现类似于噪声,有很宽的频谱,所以也称之为量化噪声。量化噪声不是随机的,它是数字系统固有的,量化越精细,量化噪声就越小。另外,量化器还会产生非线性失真。一般用信噪比来衡量数字系统的量化失真。
对于双极性的声音信号,若以n个比特量

化,可达到的最大信噪比为
Smax/NQ=6.02n+1.76(dB)
单极性的视频信号,常用图像信号的峰峰值与量化误差的均方根的比值来表示信噪比
Smax/NQ=6.02n+10.80(dB)
D1格式对视频信号10bit的量化己足够精细,在量化器线性良好的情形下量化失真对信号不构成什么影响。音频对量化失真相对敏感。
4 电缆均衡和时钟再生
事实上,传输通道中存在着对数字信号造成影响的模拟失真。譬如由电缆衰减造成的频响滚降失真、相位失真、噪声、以及由于交流耦合造成的基线漂移等。尤其是,由于串行数字信号的时钟是从信号本身恢复而来,模拟失真会引起串行数字信号的时钟抖动。长电缆传输是造成信号失真的主要原因,当使用传统的模拟同轴电缆进行串行数字视频传输时,由于其频响不佳,引起的损耗和失真更大。传输通道中的其他模拟部件也会对数字信号造成损伤,一些模拟部件在D1格式下基本不能工作。
数字信号本身具有很强的纠错能力,从而能够在相当的范围内补偿这些损耗,这是数字电视系统重要特征。通常,大多数数字设备(包括D/A转换器)都会对输入信号进行某种形式的均衡和再生处理,从送来的信号中恢复数据,并使用一个相对稳定的时钟,以清晰的波形继续传送信号,从而补偿传输中的损耗。如图5所示,数字信号经自动均衡之后,脉冲幅度与波形得到明显改善,通过PLL(锁相环路)之后,使时钟信号获得再生。数字视频的时钟再生包括串行再生和并行再生,串行再生相对简单,但其再生环路的带宽较大,PPL环路带宽内的抖动也可再生和积累。并行再生则相对复杂,但其带宽和固有抖动都比串行再生小得多。当数字系统的串行再生环节比较多时(比如达数十次),通常需要通过并行再生来消除串行再生的的PPL环带内的抖动积累。
5 抖动及其容限
尽管可以再生时钟,抖动仍然是数字视频挥之不去的固有特征。不仅仅是电缆传输,数字分配放大器、数字矩阵、连接器等无源器件及其它工作于数字串行格式的信号发生器、接收器和处理设备都会造成抖动以及其它失真。一般说来,当时钟(准确地说是从抖动的串行信号中恢复的时钟)的正向跳变沿能够确定在眼图的中间位置或其附近,保证其正确的触发时,抖动就是可以承受的,或者说是容许的。图7反映了接收机对抖动的灵敏度。
从图中可以看出,接收机对10Hz以下的低频抖动(即摆动)不太敏感,可以承受2个眼图宽度(UI:Unit Interval)的抖动,这主要是因为低频抖动在一定程度上可能对时钟边沿确定在眼图的中间位置有利;随着抖动频率的增加,接收机对抖动的承受力降低,到了10kHz,接收机只能承受

0.24UI。
6 崩溃点特性和系统的承载能力
崩溃点特性是数字电视系统的一个非常典型的特性,即直到出现崩溃(cliff)状态之前,节目信号仍然保持完好无缺。在崩溃点出现时,系统的承载能力达到极限,视频信号重现质量突然恶化。这同模拟系统有天壤之别。在模拟系统中,失真是逐渐积累的,节目信号渐次变差,直至系统承载能力达到极限。
崩溃点特性在系统测试中非常重要,可以通过对系统“加压”直至系统崩溃来了解系统工作时存在的承载“余量”,这对评价一个数字电视系统非常重要。可通过几个方面来考察系统的承载能力:1) 加长电缆(可用实电缆,也可用电缆模拟器),考察系统对长电缆带来的各种损耗和失真的承受力;2) 利用长“1”和长“0”串特殊信号,对系统的时钟恢复和PPL锁相进行“加压”,以检测其承受能力;事实上,由于扰码,数字系统中可能存在此类信号,譬如,一些色彩平坦的场的亮度和色差信号的隔行扫描就会产生相当长的“0”串;3) 对自动均衡“加压”,考察均衡器模拟功能的线性程度;这也可以通过施加特殊的信号实现,譬如长“0”串的信号产生的高直流分量间的切换,会在线性程度不好的自动均衡器上引起误码。
上述2)3)项通常叫串行数字接口SDI检测,其检测信号由一种特殊的全场信号“SDI检测场”提供。
7 定时问题
和模拟视频一样,数字视频也需要“同步”。不过在D1格式视频信号的量化规定中,并没有为“同步头”留下量化空间,而是在每个视频有效行(720个亮度码字+2×360个色度码字)的开始前(前一行的第“1724—1727”4个码字)和结束后(第“1440-1444”4个码字)插入“有效视频起始标志”(Start of Active Video SAV)和“有效视频终止标志”(End of Active Video,EAV),用SAV和EAV来实现视频定时。
值得讨论的是,数字系统的延时比模拟系统大得多。模拟系统中,延时以毫微秒计;而在数字系统中,延时则以纳秒、微秒计,串行数字信号的时钟本身容许约720ps的抖动,并行设备中则可容许±3ns的时钟抖动(注意:并行时钟周期是串行时钟周期的10倍)。所以数字系统的定时不要求象模拟系统一样精确。
数字系统的定时通常以时钟周期、毫秒、行甚至帧为单位来计量。所以,需要一些延时部件来完成定时要求,这些延时部件的延时功能要在码率较低的并行域完成。数字切换台通常会设计为具有一定延时(比如1行左右),并利用定时缓冲器实现自动定时。当延时大于切换台的规定时,数字系统仍需要外部强制同步(即帧同步)。帧同步信号的丢失会造成数字系统的混乱。
8 辅助数据的嵌入和音频同步问题
在D1格式中,

规定在视频消隐期间放置辅助数据(ANC),包括AES/EBU声音和其它数据,所以音频是嵌入式的。采用嵌入式音频,除了可在同一根电缆上传输视、音频外,还解决了视、音频的同步问题。一个数字有效行长53.3ms,如果将音频数据均匀地放置在各行,这样的延时对音频基本上没有影响。事实上,对一般受众而言,半场以内的音频延时(或超前)都是可以接受的。
不过在系统中,视音频经常是分离的,各自进行独立的处理(比如各自经过视频切换台和音频调音台)。这样就造成音频相对视频的延时(包括超前)问题。可通过增加延时器或音频同步器来解决这一问题。
对数字电视系统产生影响的还有其他一些因素,比如无源器件由于数字波长较短而可能引起的回波损耗,以及由于反射引起的数字系统难以无源环通的问题,亮度信号和色差信号间的时延,直流电平的基线漂移,等等。
三 D1格式全带宽数字电视的测试
传统上对模拟系统进行的节目信号测试在数字系统中一般而言意义不大。可以从几个方面来考察D1格式全带宽数字电视系统的主要性能指标:数字信号波形、数字数据误码检测、系统承载能力、数字数据格式及其在接口的运行验证,等等。已有许多国际标准或建议支持对这些系统指标的测试。目前,国内也正在制订相关的测试技术标准。
1 数字信号波形测量
数字信号波形一般指系统的串行输出波形,即眼图。有关眼图的基本技术指标在SMPTE259M标准中有规定,SMPTE RPl84给出了抖动测量的实用建议。图10所示为有关眼图的几个基本技术指标的规定。
1) 数字波形幅度
数字波形幅度即眼图的高度,其动态范围规定为0.8V±10%,即在720—880mV之间。超出这个范围会引起电平跳变混乱。
2) 上升时间和下降时间
上升时间规定为从上升沿20%到80%之间的时间间隔,同样下降时间规定为从下降沿20%到80%之间的时间间隔。在串行数字信号中,上升时间和下降时间具有相同的意义,即完成表示“1”的跳变,并满足时钟恢复的需求。上升时间和下降时间的规定范围是0.4-1.5ns。
在测量中,一般需要对上升时间和下降时间进行修正。若Tm为测得的上升(下降)时问,Ts为测量仪器建立被测波形时的上升(下降)时间,那么实际上升(下降)时间为
3) 过冲
数字信号的过冲应小于波形幅度的10%,即小于800×10%mV=80mV。
4)抖动
抖动有两种测量方法:一是借助于在基准信号上触发的示波器测量法,一是借助于时钟提取的抖动测量。第一种方法测量的是全部带宽上抖动粗略的概观(即定时抖动),不容许限制带宽,容易受到基准信号稳定度等因素的影响,在可以使用其它抖

动测量方法时,一般不建议使用该方法。通常利用第二种方法进行校准抖动和定时抖动的测量。校准抖动定义为信号的跳变沿位置相对于从信号本身提取的时钟的跳变沿在位置上的瞬态变化。时钟提取处理的带宽确定了校准抖动中的低频极限值。
由于由串行信号中提取的时钟,其抖动主要分布在10Hz—1kHz,所以在测试串行信号的抖动时,要求测试仪器的PPL必须有稳定的时钟常数,并具有10Hz和1kHz的高通滤波器。在10Hz高通滤波器上测得的抖动被确认为定时抖动,在1kKz高通滤波器上测得的抖动被确认为校准抖动。
串行信号抖动的容差为O.2UIP-P,以平均UI计算
0.2UI=0.2×1/(270×106)=0.74×10-9(s)
=740(ps)
2 数字数据误码检测
SMPTE RPl65规定了数字视频数据的误码检测方法,称之为误码检测和处理(Error Detection and Handling,EDH)。步骤是:在并/串转换前对每场的视频信号进行循环冗余码(Cyclic Redundant Code,CRC)计算,包括对全场(Full Field,FF)视频的CRC计算和有效场图像(Active Picture,AP)的CRC计算。将计算出的CRC插入到视频场消隐区的某一行中,随信号一起传送。在系统输出端,经串/并转换之后,重新计算视频信号的CRC,并与在视频消隐区提取的CRC数据进行比较。如果不符,即确定出现误码,误码可区分为全场(FF)误码和有效图像(AP)误码,以区别误码是出现在有效视频区还是出现在辅助数据区(即视频消隐区)。
可采用数字视频监视器的SDI选件实现EDH,并得到有关的误码报告。EDH测试不需要停播,它是一种在线测试。
3 系统承载能力测试
可以通过此类测试,获知系统可以承受的极限状态(即系统还有多少余量(headroom)),以及系统能否满足要求的承受极限。这些测试是通过改变数字信号的若干参数加重系统负担来完成的,所以又称为“加压(stressing)”测试。这方面的内容主要有四项:电缆运行长度测试、自动电缆均衡器测试、PPL锁相环测试以及抖动容限测量等。
1)电缆运行长度测试
这是SMPTE 259M提出的一个直观“加压”测试方法,即加长电缆运行长度直至信号质量恶化、系统崩溃。这样可以获得系统可达到的最长电线运行长度。在知道电缆实际运行长度、接收器灵敏度以及电缆的可增加长度的情形下,可依此确定系统是否有足够的余量储备,以及这个余量是否系统所期望的数值。
可以应用EDH进行系统失败的客观测量,包括考察系统从误码增加到信号质量严重恶化这之间的“电缆长度—误码率曲线”的实际情形,是否符合理想的崩溃点特性。
在测试中可以采用加长实电缆的长度的办法,也可以用电缆模拟器来模拟加长电缆的情形。
2)自动电缆均衡器测


自动电缆均衡器测试和PPL锁相环测试都是对数字视频系统的低频响应的评估。这主要是因为,低频跳变在自动电缆均衡器上引起的误码和对时钟恢复造成的困难是数字电视系统误码的主要因素。SMPTE RPl78提出了用于这两种测试的SDI检测场,试图通过SDI检测场提供的很难处理的“有病”信号,达到对系统的“加压”测试。SDI检测场的上半场用于进行自动电线均衡器测试,下半场用于进行PPL锁相环测试。
为加重自动均衡要求,SMPTE RPl78建议采用最长的“0”或“1”串和单个时钟周期的相反极性的“1”或“0”组成有效行上的串行数据流。为此在SDI检测场的上半个有效场中将亮度信号Y的电平级规定为300h,两个色差信号Cb和Cr的电平级规定为198h。D1格式信号按CbY CrY Cb……的顺序传输数据字,这样就形成了每个有效行上300h和198h的交替传输序列。该序列经过扰码后形成由一个“1”(或“0”)和19个“0”(或“1”)交替传输构成的低频序列,即200h、000h的交替序列或1FFh、3FFh的交替序列。这种测试信号通过自动均衡器时会在每帧的一些时间上建立非常大的直流分量。
可以通过数字波形示波器的“图像”显示方式,检测由于自动电缆均衡的线性不好造成的跳变点误码的情况。
3) PPL锁相环测试
PPL锁相环测试要求串行数字信号具有最大的低频分量和最少的过零点。
为此在SDI检测场的下半个有效场中将亮度信号Y的电平级规定为200h,两个色差信号Cb和Cr的电平级规定为110h。这样就形成了每个有效行上200h和110h的交替传输序列。该序列经过扰码后形成由20个“1”和20个“0”交替传输构成的低频序列。
该测试信号经过PPL锁相环时,如果造成图像紊乱和丢失,表示它不能被锁相环锁相。由于数字串行信号在扰码后确实可能出现这一类的数据码流,所以带有这种不能对检测场信号锁相的PPL环的接收机可以被认为是不安全的。
4) 抖动容限测量
抖动容限测试需要已校准的抖动发生器和误码测量(如EDH)装置。SMPTE RPl92描述了其测试方法:先将抖动发生器的抖动幅度设定于0UIpp,验证系统处于无误码运行状态;而后根据需要设定发生器的抖动频率,并增大抖动幅度,直至达到发生差错的门限,记录下抖动的幅度和频率,对于足够数量的频率重复这一步骤,并最后确定抖动容限曲线。
4 数字数据格式及其接口运行验证
可以通过一些特殊的测试信号,对数字电视系统中数字数据的格式及其在接口中的正确运行进行验证。ITU—R 25/11课题小组作过这方面的深入研究,并提出了一组测试信号。除了SDI检测场外,这组测试信号共有15个。表1对这些测试信号进行了简要的描述。


上述所示波形仅是一个粗略的描述,数字测试信号对有效行内每一个像素的电平级都有精确的描述,从而保证所形成的数据流对相应的测试有效。
5 其它测试内容
除了上述介绍的测试内容外,D1格式的全带宽系统通常还进行一些其它内容的测试,这些测试包括:视、音频的信噪比测试,系统的视、音频幅频特性测试,用于辅助数据(ANC)鉴别的格式校验,等等。参考文献
1 ITU-R,Recommendation601,656,etc.
2 SMPTE,Proposed SMPTE Standand:10-Bit 4:2:2 Component and 4fsc NTSC Composite Digital signals:Serial digital Video Signal(SMPTE 259M)
3 SMPTE,Proposed SMPTE Recommended Practice:Serial Digital Interface Check Field for 10-Bit 4:2:2 component and 4fsc Composite digital Signals (RP 178)
4 SMPTE,Proposed SMPTE Recommended Practice:Specification of Jitter in Bit-Serial Digital Systems (Revision of RP 184-1995)
5 SMPTE,Proposed SMPTE Recommended PRactice:Jitter Measurement Procedures in Bitserial Digital Interfaces(RP 192)
6 SMPTE,Proposed SMPTE Recommended Practice:Error Detection Checkwords and Status Flags for in Bit-Serial Digital Interfaces for Television(RP 165)
7 Singar Bala,etc.,An IC Implementation of SMPTE RP 165:Error Detection and Handling,july 1995,SMPTE Joumal
8 邢卫东、练金添?数字电视中的图像编码和压缩讲义:数字电视信号及其格式?岭南视听研究(视频数字技术特刊),1999
9杜百川?数字电视?广播电视科技快报(特辑),1997
10 Grass Valley,Digital System Design,1993
11 潘仁鑫?全带宽数字电视基础和测试?世界广播电视,2、3,2000
12 广播电影电视部科技司,等?国际电联(ITU)建议书汇编:广播电视数字技术专集(1994~1998研究期),1997














什么是场消隐

模拟示波器看波形扫描方向是从左到右,屏幕上光点回到左边时虽然速度很快,仍能看到回扫线,把这回扫线去掉让人眼看不到,就叫“消隐”,相应的电路叫消隐电路,普通电视机也是如此。


电视信号是一行一行扫描进行的.电视机在从左扫描到右,再扫描下一行的时候,需要关闭电子枪.这个动作叫行消隐.
在扫描完一场信号重新换另一场信号时,扫描束从右下角回到左上角,这个时候关闭电子枪的动作叫场消隐.

在CRT中是用來消掉會掃線的,現在lcd(或所謂的數位tv)中剛好用這個地方來加一些數據































采用FPGA通过BT.656接口实现传输4路视频流的方法
刘潇1,高峻2

(1、南京邮电大学通信与信息学院,江苏省南京市 210003;

2、中兴通讯南京研究所,江苏省南京市 210012)

引言
ITU-R BT.656定义了一个并行的硬件接口用来传送一路4:2:2的YCbCr的数字视频流。视频流的分辨率为720×576像素的D1格式。我们需要发送的视

频数据源通常是经过MPEG2压缩的,分辨率为352×288像素的CIF格式。在输出到显示终端前,处理器需要对CIF格式的图像数据插值为D1(720×576像素)格式,然后再通过ITU-R BT.656并行的硬件接口输出给视频编码器。在这种前提下,可以利用一个ITU-R BT.656的硬件接口传输4路不同的CIF格式的视频数据流,然后在接收侧通过FPGA(现场可编程门阵列)将4路视频数据流分离、插值生成D1格式的数据输出给视频编码器。通过该方式,可以克服某些视频处理器输出端口的限制,使视频输出端口扩展为原来的4倍。同时,由于使用FPGA进行插值运算,分担了一部分视频处理器的工作量。
1 硬件连接
图1展示了一个BT.656并行硬件接口用来连接一个视频处理器和视频编码器的情况。该硬件接口由8根数据信号和1根时钟信号组成。

图2所示是通过FPGA扩展4路视频的连接方式。FPGA通过BT.656接口接收视频处理器发出的数据信号,然后将4路视频信号分离、插值后通过4路BT.656并行硬件接口输出到4个视频编码器,实现视频处理器一个视频输出端口同时输出4路视频信号。

2 数据结构
2.1 标准BT.656并行数据结构
BT.656并行接口除了传输4:2:2的YCbCr视频数据流外,还有行、列同步所用的控制信号。如图3所示,一帧图像数据由一个625行、每行1 728字节的数据块组成。其中,23~311行是偶数场视频数据,336~624行是奇数场视频数据,其余为垂直控制信号。

BT.656每行的数据结构如图4所示。

图4中,每行数据包含水平控制信号和YCbCr。视频数据信号。视频数据信号排列顺序为Cb-Y-Cr-Y。每行开始的288字节为行控制信号,开始的4字节为EAV信号(有效视频结束),紧接着280个固定填充数据,最后是4字节的SAV信号(有效视频起始)。
SAV和EAV信号有3字节的前导:FF、FF、00;最后1字节XY表示该行位于整个数据帧的位置及如何区分SAV、EAV。XY字节各比特位含义见图5。

图5中,最高位bit7为固定数据1;F=0表示偶数场,F=1表示奇数场;V=0表示该行为有效视频数据,V=1表示该行没有有效视频数据;H=0表示为SAV信号,H=1表示为EAV信号;P3~P0为保护信号,由F、V、H信号计算生成;P3=V异或H;P2=F异或H;P1=F异或V;P0=F异或V异或H。
2.2 使用BT.656并行接口传输4路CIF格式视频的数据结构
视频处理器的输出是灵活多变的,可以改变处理器的输出数据结构来同时传送4路252×288像素的视频信号。BT.656并行接口传输的有效视频数据流为720×586,正好可以分割为4个360×288像素的空间来传输4路352×288像素的视频数据。多余的空间用固定数据“8010”进行填充。
修改后的数据结构如图6所示。

原来存放第1场的数据的位置用来存

放第1、第2路视频数据;原来存放第2场的数据的位置用来存放第3、第4路视频数据。
3 FPGA实现的功能
FPGA主要用来完成4路352×288像素视频流的分离,以及将视频流插值到标准BT.656接口所需的720×586像素的分辨率。同时,该FPGA还要重新生成SAV、EAV帧控制信号,结合插值后的4路视频流产生新的符合BT.656结构的数据帧传送给视频编码设备。其功能框图如图7所示。

首先,4路352×288像素的视频流从BT.656结构的帧结构中分离出来,分别存储到各自的存储空间。然后,352×288像素的视频流被读取、插值为704×288像素,然后再填充为720×288像素的视频流。在成帧的模块中,产生BT.656的帧结构所需的SAV、EAV信号;将插值生成的720×288像素的数据作为偶数场的数据填入BT.656的帧结构中,奇数场的数据复制偶数场的数据。最后,将生成的BT.656标准视频流发送给视频编码器输出到显示终端上。
3.1 存储器选择
由于需要同时存储4路352×288的视频流,需要的存储空间为4路×288行×352×2字节(视频流为4:2:2的YCbCr信号,一个点通过亮度信号和色差信号来表示,所以图像的一个点实际占用2字节)。计算可得需要800 kB左右的空间。低成本的FPGA内部很难提供如此多的存储空间,可以外挂一片1MB容量的SRAM用于存储视频数据。
BT.656接口定义的时钟频率为27 MHz。SRAM要能提供1路8 bit×27 MHz数据写入,4路8bit×27 MHz读出,总共1Gbit/s以上的数据带宽。可以选择位宽为16 bit、工作时钟频率100 MHz、带宽为1.6Gbit/s的SRAM。
3.2 插值算法
将352×288像素的原始视频流变换为714×288像素的视频流就需要进行插值。该插值运算是一维的,也就是说只需要加倍每行的点数而行数不变。插值运算前,应该先将Y、Cb、Cr信号分离,然后分别对Y、Cb、Cr信号进行插值。简单的插值法有最近邻域法和线性插值法等。最近邻域法是插入点的值简单复制邻近点的值;线性插值法是插入点相邻的两个数据取算术平均值,得到插入值。应用更加复杂的插值算法可以改善图像质量。在本文设计中,实现这两种简单的插值方法就已经满足需求。
4 结束语
本文提出一种利用一个BT.656接口传输4路视频流的方法。该方法利用FPGA接收4路CIF格式的视频数据,然后分离、插值为4路D1格式视频流后,重新生成BT.656的数据帧发送给视频编码芯片,从而实现视频处理器的一个硬件接口传输4路视频图像。通过该方法可以克服视频处理器芯片输出端口的限制,增加了其扩展性。在实际测试和应用中,取得了满意的效果。



















视频编码讲坛之H.264前世今生
2009年3月2日 09:47
随着HDTV等高清资源的兴起,H.264这

个规范频频出现在我们眼前,HD-DVD和蓝光DVD均计划采用这一标准进行节目制作。而且自2005年下半年以来,无论是NVIDIA还是ATI都把支持H.264硬件解码加速作为自己最值得夸耀的视频技术。而数码播放器领域也吹来了高清和H.264的风潮,国内外不少数码播放器厂商都已经开始支持此类编码的视频文件,同时网络资源的丰富程度也逐渐提升。那H.264到底是何方“神圣”呢?和传统的RMVB等编码相比,有什么先进之处吗?

H.264,同时也是MPEG-4第十部分,是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。

什么是H.264?H.264是一种高性能的视频编解码技术。目前国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。而H.264则是由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码(Advanced Video Coding,AVC),而且它将成为MPEG-4标准的第10部分。因此,不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。

H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25∶1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102∶1!H.264为什么有那么高的压缩比?低码率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。

H.264算法的优势

H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantization)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。

H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2视频压缩标准发布以后的最新、最有前途的视频压缩标准。H.264是由ITU-T和ISO/IEC的联合开发组共同开发的最新国际视频编码标准。通过该标准,在同等图象质量下的压缩效率比以前的标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准。

一、H.264的发展历史
 
H.264在1997年ITU的视频编码专家组(Video Coding Experts Group)提出时被称为H.26L,在ITU与ISO合作研究

后被称为MPEG4 Part10(MPEG4 AVC)或H.264(JVT)。

H.264的高级技术背景

H.264标准的主要目标是:与其它现有的视频编码标准相比,在相同的带宽下提供更加优秀的图象质量。

而,H.264与以前的国际标准如H.263和MPEG-4相比,最大的优势体现在以下四个方面:

1. 将每个视频帧分离成由像素组成的块,因此视频帧的编码处理的过程可以达到块的级别。

2. 采用空间冗余的方法,对视频帧的一些原始块进行空间预测、转换、优化和熵编码(可变长编码)。

3. 对连续帧的不同块采用临时存放的方法,这样,只需对连续帧中有改变的部分进行编码。该算法采用运动预测和运动补偿来完成。对某些特定的块,在一个或多个已经进行了编码的帧执行搜索来决定块的运动向量,并由此在后面的编码和解码中预测主块。

4. 采用剩余空间冗余技术,对视频帧里的残留块进行编码。例如:对于源块和相应预测块的不同,再次采用转换、优化和熵编码。

H.264的特征和高级优势

H.264是国际标准化组织(ISO)和国际电信联盟(ITU)共同提出的继MPEG4之后的新一代数字视频压缩格式,它即保留了以往压缩技术的优点和精华又具有其他压缩技术无法比拟的许多优点。

1.低码流(Low Bit Rate):和MPEG2和MPEG4 ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3。

显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。

2.高质量的图象:H.264能提供连续、流畅的高质量图象(DVD质量)。

3.容错能力强:H.264提供了解决在不稳定网络环境下容易发生的丢包等错误的必要工具。

4.网络适应性强:H.264提供了网络适应层(Network Adaptation Layer), 使得H.264的文件能容易地在不同网络上传输(例如互联网,CDMA,GPRS,WCDMA,CDMA2000等)。

二、H.264标准概述

H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求。

技术上,它集中了以往标准的优点,并吸收了标准制定中积累的经验。与H.263 v2(H.263+)或MPEG-4简单类(Simple Profile)相比,H.264在使用与上述编码方法类似的最佳编码器时,在大多数码率下最多可节省50%的码率。H.264在所有码率下都能持续提供较高的视频质量。H.264能工作在低延

时模式以适应实时通信的应用(如视频会议),同时又能很好地工作在没有延时限制的应用,如视频存储和以服务器为基础的视频流式应用。H.264提供包传输网中处理包丢失所需的工具,以及在易误码的无线网中处理比特误码的工具。

在系统层面上,H.264提出了一个新的概念,在视频编码层(Video Coding Layer, VCL)和网络提取层(Network Abstraction Layer, NAL)之间进行概念性分割,前者是视频内容的核心压缩内容之表述,后者是通过特定类型网络进行递送的表述,这样的结构便于信息的封装和对信息进行更好的优先级控制。

小结:H.264=优秀+通用

众多的专业术语让人头晕眼花,不过总结起来,很简单,H.264就是MPEG-4标准中的一个项目,凭借其自身的优越性和通用性,成为国际认可的一个标准。












常见的几种视频编码格式介绍!!!(一)
RMVB/RM在制定的时候主要考虑的是网络传播,目的在于利用不快的网速传播视觉可以接受的画面质量。因此,RMVB/RM编码格式的特点是较低码率下能获得较好的视频质量。但高视频编码率的情况下反不如其他编码格式。同样是RM/RMVB后缀的文件,其内部编码格式细分还有R8/R9/R10等,但总的来说,上面所说的特点依然是存在的。只是视频压缩率更高了,因此RMVB没人用在高清编码领域。RMVB追求的是高视频压缩率,能接受的画面质量,所以经常压缩掉一些不容易注意的细节。初看画面不错,细看就发现画面不锐利,层次不分明,总给人一直模糊的感觉。RMVB/RM后缀文件的音频编码部分同样存在这样的情况,声音压缩率很高,但只是能听,不要奢望达到声音动听的境界。RMVB的流行,一是因为REAL的这种格式适合低速网络的传播,能以较小的文件体积获得可以接受的画面质量。二是随着RMVB的使用,开始出现功能比较完善的转码软件和解决方案,方便了视频爱好者,扩大了影片来源。但随着网速越来越快,H264等更好的视频编码器出现,同时也因为RMVB不适合高清视频制作,且若对于其他硬件厂家希望支持RMVB/RM格式,就必须向REAL公司支付相当昂贵的专利费,导致很多硬件厂商放弃了对RMVB文件的支持。RMVB的文件已经不是以前那种完全压倒性的优势了。现在网络传播的视频文件已经很多都是AVI、MKV、MP4、3GP等后缀了。其中MKV等多用于高清视频文件,MP4、3GP等多用于手机和便携式设备等领域,AVI则使用范围更加广,不但在高清晰度视频文件中有AVI文件,在便携式设备领域也有AVI使用。
VCD用的视频编码格式为MPEG1,DVD的则为MPEG2,VCD和DVD都主要用于家庭影音播放,而且一般来说,VCD用的MPEG1编码为固定码

率的视频编码。DVD可以支持动态码率的MPEG2编码。为了能保证激烈变化画面的时候的清晰度,其默认编码率都比较高,VCD标准编码率为1152Kbps,DVD开放些,根据影片播放时间,常设置为5000 Kbps -8000 Kbps之间,在不浪费DVD碟容量的前提下尽可能的使用较高的码率获得更高的清晰度。MPEG1和MPEG2在超低码率情况效果不佳,且过分提高码率,画面效果带来的提示也不明显。
AVI文件常用的视频编码为Xvid和Divx,但Divx是一种收费的视频编码格式,开发之初利用了开源社区的力量,但后封闭起来成为一种收费的视频编码格式,违反了开源社区的游戏规则,因此与开源社区有过节。Xvid则是在Divx脱离开源社区以后,由开源社区在Divx技术积累的基础上独立研发的新的符合MPEG4规范的视频编码格式,视频编码效果很好,对硬件要求也不高,同时由于Xvid的免费与开放性,Xvid获得了众多硬件厂家的支持,所以现在很多DVD碟机和MP4等硬件设备都可以直接播放Xvid编码的AVI文件。可以说,能支持Divx的设备一般都支持Xvid。同时Xvid视频编码也是DVD Rip的标准编码方式之一,因此很多高清视频文件也用Xvid进行视频编码。由于大量的DVD碟机和MP4提供了良好的硬件支持,Xvid编码已经成为事实上最常用的编码格式之一。Xvid编码的特点是在低码率的情况下,效果不输于RMVB,同时对于硬件运算能力的要求低于RMVB,高码率的情况下能达到很不错的清晰度,效果远远高于RMVB。同时Xvid对于动画视频还做了特殊优化。
H264编码也是一种符合MPEG4规范的视频编码格式。应该算目前能用上的最先进的视频编码方式了,特点是在低码率的情况下,依然能获得很好的画面视觉效果。因此在320×240分辨率的情况下,要保持较高的清晰度,Xvid一般常用320-350Kbps码率,但H264只需要200多Kbps码率就能达到同样的画面效果。同时,H264的高压缩率,也能满足高清领域压缩的需求。随着画面分辨率的变大,为了保持清晰度,需要的编码率会以比分辨率更快的速度增加,导致文件体积快速增加,特别是达到1080P级别的时候,一个影片的体积为几G乃至几十G,此时H264的高压缩率特点特别适合制作高清视频,H264的压缩率比MPEG2高出好几倍。一个使用MPEG2编码制作的高清文件可能会达到30G甚至更多,但使用H264编码制作的话,可能只需要4-5G就足够了。但是,H264的这种高压缩率带来的副作用就是最硬件运算能力要求比较高,用H264编码速度较慢,且使用H264编码的高清视频很多单核电脑放不了,好在现在双核电脑的流行基本解决了这个问题,在便携式设备上,由于多数厂家设计能力所限,普遍CPU运算能力都低,H264也就无法

支持,因为在便携式设备上,一旦CPU速度超过400M Hz或者达到更高的速度的时候,不但对CPU设计、制作提出了高要求,而且对于电路设计也提出了新的要求,在低速CPU主板设计时可以忽略不计的射频干扰等问题,但如果要达到更高的速度,就必须解决,很多厂家的设计能力都不足以解决这方面的问题,因此,市面上的MP4设备多可以支持Xvid编码,但无法支持H264编码。
常见的几种编码格式介绍!!!(二)
微软自己的ASF/WMV文件有专用的视频编码格式,也有几代不同的视频编码格式,新一代的视频编码格式压缩率更高,效果更好。ASF文件其实与WMV文件是一回事,只是后缀不一样罢了,可以手动修改更换后缀,没关系的。但由于微软的这种格式可以附带播放权限控制,加入了文件权限控制的ASF/WMV文件,只能通过电脑播放,其他设备如标称支持ASF格式的MP4播放器等都无法播放,且在电脑上播放时,必须链接进授权者的网站,很多居心不良的网站就乘机在授权网页上挂木马。RMVB文件可以弹出网页木马,但RMVB的弹出页面是设置在RMVB文件里面的,你可以用软件或者手工去除这种弹出设置,或者不联网看RMVB文件也可以,不链接到指定网页并不会影响到正常播放。但ASF/WMV的危害更加严重,如果需要播放有授权限制的ASF/WMV文件,必须链接进指定网页获得授权,否则不能播放。因此,假设授权页面暗藏木马,除非你不看这个ASF/WMV文件,否则开始获取播放授权就必中网页木马。由于ASF/WMV文件内部也有几代不同的编码器,即使在标准支持ASF的设备上,也可能遇到不能播放的ASF/WMA文件。因为可能不支持某种视频编码器或者编码组合,这个情况与AVI相似,其他封装格式也都有这类问题。而且ASF/WMV所用的编码器,论压缩率比不上H264,论兼容性和开放性比不上Xvid,因此,不是必须情况,一般不建议转换ASF/WMV文件。

随着FLV和3GP文件的流行,H263视频编码格式在日常使用中也经常用到。H263压缩率其实并不高,但对硬件要求比较低,因此被手机等平台选择为主要支持的视频编码之一。FLASH从FLASH8开始,就支持H263视频编码的FLV文件。现在很多视频共享网站的FLV文件视频部分用的就是H263编码。但由于H263压缩率并不高,因此视频网站的约20分钟FLV视频文件体积大小约为40M左右,但并不清晰,激烈动作画面则更加模糊。很多非智能手机本身屏幕就不大,分辨率很低,也谈不上什么清晰度,用H263也无所谓。FLASH完全就是为了适应网络传播而设计的,帧率极低,默认只有12帧,一般的FALSH动画文件用的是矢量技术,可以随意放大缩小而不失真,但FLASH的FLV文件是基于位图技

相关主题