멀티미디어 지식공작소 | '영상처리 기술/영상부호화' 카테고리의 글 목록
멀티미디어 지식공작소 위치로그  |  태그  |  미디어로그  |  방명록
icon 영상처리 기술/영상부호화 에 해당하는 글18 개
2008.02.03   [펌] 멀티미디어 전성시대를 연다「DIVX」


icon [펌] 멀티미디어 전성시대를 연다「DIVX」
영상처리 기술/영상부호화 | 2008. 2. 3. 17:58
출처 블로그 > semigifn님의 블로그
원본 http://blog.naver.com/semigifn/10000450314

멀티미디어 전성시대를 연다「DIVX」

박종하   2004/11/29
멀티미디어는 인터넷보다 더 오래된 화두이다. 1990년 마이크로소프트를 중심으로 MPC(Multimedia PC) 레벨 1을 발표했다. 사실상 CD-ROM 하나 달랑 달아놓고 멀티미디어 PC라고 우기는 것처럼 보인다. 이후에 1993년에 발표된 MPC 레벨 2에서는 ‘Video for Window’와 그것을 기반으로 하는 ‘640×480×16비트’ 컬러의 동영상 재생과 16비트 음원 재생 조건을 명시한다. 10년이라는 세월은 1920×1080×30fps의 HD 영상과 5.1~7.1채널의 고음질 멀티미디어 시대로 바꾸어 놓았다. 여기서는 이 시대의 PC를 위주로 한 멀티미디어 재생 환경과 포맷에 대해 얘기해 보겠다.

DivX 전성시대
공룡의 전성시대는 중생대 쥬라기이다. 21세기 현대 인터넷은 DivX라는 공룡의 시대이다. 아마 DVD, 공중파 HDTV보다 DivX로 영화를 보는 사람이 많을지도 모른다. MPEG-2를 기반으로 하는 DVD보다 MPEG-4를 기반으로 하는 DivX는 압축률이 높기 때문에 CD 1~3장 정도의 분량에 DVD 영화와 크게 차이나지 않는 화질과 음질로 저장할 수 있는 큰 매력이 있다. 정품 DVD 시장이 불법 DivX 영상 때문에 황폐해진다는 영화와 음반 산업계의 경고가 DivX 영화를 하루아침에 사라진 공룡처럼 초토화시켜 버릴지도 모르겠다. 하지만 점차 고화질, 고음질로 고품질화되는 멀티미디어 파일에 DivX라는 기술과 여기에 사용되는 DivX, DIVX, AC3, DTS 등의 용어의 의미와 이유를 짚어보자.

DIVX와 DivX
DivX의 어원(?)은 DIVX이다. 현재 사용되고 있는 DivX라는 이름은 DIVX(DIgital Video eXpress의 약자)에서 따온 것이다. 그러나 DIVX와 DivX는 이름만 같은 뿐, 전혀 관련이 없는 것이다. 하지만 DivX의 이름을 DIVX에서 따온 것에는 이유가 있고 역사를 되짚어 보는 것도 재미있으니 DIVX에 대해 먼저 알아보자.
DIVX는 1997년에 미국 최대의 전자유통 회사 중 하나인 서킷 시티(Circuit City)와 할리우드 영화 판권 중계업을 하는 지프렌(Ziffren), 브리텐햄(Brittenham), 밴카&피셔(Banca&Fischer)의 3개사가 공동으로 출자한 디지털 비디오 익스프레스(Digital Video Express)가 개발한 DVD 형식의 디스크를 위한 비디오 영화 대여 시스템이었다.

DIVX를 이용하려면 300~500달러 정도의 모뎀, 암호화 마이크로칩, 그리고 플래시 메모리 등 DIVX가 장착된 DVD 플레이어를 구입해야 했다. 그 후 DIVX 디스크를 넣고 DVD 플레이어에 붙어 있는 재생 단추를 누르면 만 48시간 동안만 그 디스크를 재생해 비디오 영화를 볼 수 있었다. 반환하지 않는 대여 디스크인 셈이다. 첩보영화에 나오는 자동파괴 디스크와 개념적으로 흡사하다고 할 수 있다. 그리고 추가로 그 비디오 영화를 더 보고 싶을 때는 전화선과 연결된 모뎀을 통해 시청 시간을 연장할 수 있었다.

기존 DVD 타이틀이 1편당 20∼30달러이며 대부분 구입한 타이틀을 2번 이상 반복해서 보지 않는다는 점을 감안할 때, 5달러 이하에 DIVX용 DVD 타이틀을 살 수 있다는 점과 불법복제를 차단할 수 있는 장점 때문에 관련 업계로부터 상당한 호응을 얻었다. 장비 제조업체 중 미국의 제니스(우리나라의 LG전자에서 공급)와 톰슨, 일본의 마쓰시타는 이 기술을 수용하겠다는 입장을 표명했으며, 메이저 영화사에서는 그때까지 DVD 타이틀 제작에 미온적인 반응을 보여왔던 디즈니를 필두로 파라마운트, 유니버설, 드림웍스가 이 기술을 지지하고 나섰다. 그러나 여러 DVD 업체와 시민단체들의 반발이 계속되면서 소비자들이 외면하게 되었고 1999년 6월 16일 DIVX의 회장은 이 새로운 포맷이 시장에서 실패했고 2년 후 업계에서 완전히 철수할 것이라고 공식적으로 발표했다.

DivX의 탄생
맥스모리스(MaxMorice)라는 닉네임을 가진 프로그래머가 마이크로소프트가 ASF 파일 형식을 위해서 만든 MPEG-4 코덱에 걸려 있는 제한을 바이너리를 조작, 변경 가능하게 하고 음성(사운드트랙)은 MP3로 대체한 코덱을 ‘DivX’라는 이름으로 발표했다. 이 DivX는 발표되자마자 순식간에 인터넷을 통해 전 세계로 퍼져나가게 되었는데, 그 이유는 DeCSS를 이용해 DVD를 복제한 후 DivX라는 동영상 형식으로 만든 영화는 거의 DVD와 비슷한 화질을 보여주면서도 CD 한두 장 분량에 충분히 들어가므로 인터넷이나 PC통신의 영화 동호회를 중심으로 엄청난 속도로 퍼져나갈 수 있었기 때문이었다.

실제로 DivX를 유명하게 만든 것은 ‘DivX ;-) 3.11 alpha’이다. 불과 얼마 전까지만 해도 대부분의 DivX는 이 언더그라운드 포맷인 DivX 3.11로 만들어졌다. 얼굴이 알려지지 않은 수많은 사람들과 그룹들이 DivX로 만들어진 고화질의 영화를 계속해서 쏟아냈고 수많은 네티즌들이 이를 다운로드해서 보곤 했다. 그래서인지 와레즈과 같은 언더그라운드에서 사용하는 것과 같이 대소문자를 섞어 쓰는 표기법을 이용해 초기의 DIVX와는 다르게 ‘DivX’라고 표기를 하고 윙크하는 이모티콘 ;-)을 붙여 사용했다. DivX ;-) 3.11 alpha와는 별도로 여러 가지 시험용 코덱들이 개발되었는데 그중에 Project Mayo 그룹에서 개발한 DivX 4.X(4.12까지 발표되었음)도 있다. DivX 4.X는 기본적으로는 DivX 3.X와 호환성을 가지고 있으나 실제 업그레이드 버전이 아니라 별도로 만들어진 코덱이기 때문에 많은 문제를 일으켰다.

얼마 전에는 DivX의 개발자 중 한 명인 프로그래머 제로미 로타는 조던 그린홀과 공동으로 DivX 네트웍스를 설립하고, DivX 5.0를 출시했다. DivX 네트웍스는 많은 네티즌의 비판에도 불구하고 DivX 상용화에 박차를 가하고 있다. DivX 5.0을 기존의 DivX와 달리 상용화된 제품인 것이다. 이러한 DivX의 상용화에 반발해 XviD라는 새로운 코덱이 개발됐다. DIVX에서 DivX의 이름을 따 왔듯이 XviD는 DivX를 거꾸로 쓴 이름이다. 최근에 DivX 동영상이라고 하면 대부분 DivX 5.0 또는 XviD 코덱으로 압축된 것들이다.

영상 부분은 기술적으로 많이 발전하고 변화했지만, 겉보기로는 큰 차이를 못 느끼는 경우가 많다. 하지만 음성 부분은 초기에는 스테레오(MP3)가 대부분이었지만 이제는 5.1채널 입체음향(AC3)이 대세를 이루고 있다. 대부분 한 장이었던 DivX가 최근에는 두세 장 이상으로 늘어난 이유는 멀티 채널 사운드 때문이다. 좁은 의미에서 DivX 파일은 영상 압축에 DivX 코덱을 이용해서 만든 동영상 파일을 의미하지만 넓은 의미에서 DivX 뿐만 아니라 그와 유사한 XviD, MP4, DX50 등을 이용해서 모든 동영상 파일을 의미한다.

코덱은 컨테이너가 아니다
대부분의 사람들이 알고 있는 영상 파일의 확장자인 AVI, WMV, ASF, MOV 등은 그 자체만으로 이뤄진 것이 아니다. 내부에 많은 다른 형식의 데이터로 이뤄져 있으며 이것들을 제어하는 헤더가 동영상 파일에 대한 전체 정보를 담고 있는 것이다. 하나의 AVI 파일 안에는 압축된 동영상(DivX, Xvid, VP6 등의 코덱으로 압축된 영상 데이터)과 사운드(MP3, OGG, WMA 등의 음성 데이터)가 계층을 이뤄 포함되어 있고 이 두 개의 트랙을 감싸는 식의 컨테이너(container) 형식으로 AVI가 존재하게 된다. 이 컨테이너는 나중에 동영상을 재생할 때 플레이어에게 그 영상의 데이터를 알려주는 역할을 하게 된다. 내부의 동영상과 음성의 데이터량이 같다고 할 때 이 데이터들을 잘 제어하고 유지하는 기능이 컨테이너 포맷의 핵심 기능이다. 동영상을 담기위한 컨테이너 포맷은 크게 마이크로소프트의 AVI와 ASF, 애플 퀵타임의 MOV가 있다.

AVI 컨테이너
AVI는 90년대 초반에 마이크로소프트에서 제안한 형식이다. 이 형식은 비디오와 오디오 압축 데이터를 담는 매우 유연한 포맷으로 최근까지 사용되고 있다. 초기부터 AVI 형식은 VFW(Video for Windows) 프레임워크를 기반으로 컨테이너로서 뿐만 아니라 API와 연동돼 프로그래밍할 수 있도록 설계되었다. 하지만 VFW 프레임워크는 최근의 오디오와 비디오 형식에 수반되는 많은 개선된 기능들을 지원하지 못한다. 예를 들어 VBR(Variable Bitrate Audio), VFR(Variable Framerate Video) 등은 AVI 컨테이너는 지원하지 못한다. 이런 단점을 보완하고자 90년대 중후반에 Open DML AVI 형식이 발표되었으나 이 역시 최대 파일 크기 2GB의 한계를 가지고 있고 그 이후에는 특별한 개선을 위한 노력은 없다고 할 수 있다.

MOV
MOV는 애플의 퀵타임 동영상 포맷으로서 퀵타임 무비 플레이어를 설치해 재생이 가능하다. 퀵타임 포맷은 AVI 포맷에 비해 압축률이 뛰어나며 화질도 나은 것으로 알려져 있다. 원래는 매킨토시용으로 나왔으나 그 뛰어난 성능으로 많은 사람들의 관심을 끌자 ‘QuickTime for Windows’라는 이름으로 윈도우용이 나오게 되었다. 퀵타임 규약의 특징은 압축 방식의 다양함에 있는데 애플은 퀵타임 규약을 설계할 때 다른 회사들이 마음 놓고 새로운 압축/해제 방식을 추가할 수 있도록 했다. 이 때문에 같은 MOV 확장자를 가진 퀵타임 동영상 파일이라고 해도 실제로는 다른 압축/해제 방식을 사용하는 파일일 수 있다.

ASF
ASF는 ‘Advanced Streaming Format’의 약자로 마이크로소프트가 내놓은 스트리밍이 가능한 컨테이너 형식이다. 마이크로소프트는 어도비, 인텔, 리얼네트웍스, 바이보(Vivo)와 함께 AVI의 인터넷 확장판으로 볼 수 있는 ASF라는 새로운 멀티미디어 파일 표준을 공동 개발했다. ASF는 통합 멀티미디어 파일로 파일 안에는 오디오, 비디오, 이미지, URL, 심지어는 실행 프로그램까지 들어 있다. ASF 파일의 장점은 스트리밍, 즉 인터넷에서 파일을 다운로드하면서 동시에 재생이 가능하다는 점으로 고성능 전용선이 아니더라도 56Kbps 모뎀 정도면 부드럽게 재생된다. 윈도우 미디어 플레이어에서 이 파일을 지원한다. 그리고 사용되는 인코더의 버전에 따라 확장자가 달라진다. 윈도우 미디어 인코더 4.1에서는 asf로 확장자가 정해지며 이후 버전에서는 비디오는 wmv, 오디오에는 wma로 쓰인다.

<그림 2> 윈도우 미디어 포맷

코덱
코덱(Codec)은 ‘Compression/DECompression’이라는 압축/해제의 약자로서 영상 혹은 음성의 아날로그 신호를 디지털 신호로 변환하는 코더(coder)와 디지털 신호를 음성이나 영상으로 바꾸어 주는 디코더(decoder)의 합성어이다. 음성 정보를 비롯해 영상 정보 등 많은 정보가 아날로그 신호로 돼 있는데 이들 전기 신호를 디지털 전송로를 통해 반송하기 위해 아날로그 신호로부터 디지털 신호로, 또 반송된 디지털 신호를 아날로그 신호로 변환하는 것을 변복조 또는 부호화/복호라고 하며 그 기능을 가진 장치를 코덱이라고 한다. 영상정보가 기록된 장치를 컴퓨터에서 구동시키기 위해서는 코덱 파일을 설치하여 해당 정보를 볼 수 있도록 해주어야 한다. 코덱 파일이 없다면 영상 파일을 볼 수 없기 때문이다.

윈도우 98 SE 이상에 설치된 윈도우 미디어 플레이어가 있다면 대부분 영상 정보를 디지털화해 볼 수 있도록 기본적으로 코덱이 설치되어 있다. 그러나 최근에 나오는 코덱으로 이뤄진 영상을 보려면 해당 코덱을 설치해야 하는데, Divx라는 코덱으로 이뤄진 영상을 보려면 반드시 Divx 코덱을 윈도우에 설치해 줘야 한다. 만일 DivX 코덱을 설치하지 않고 영상을 플레이하면 음성밖에 나오지 않는 등의 오류가 생기고 영상은 볼 수 없게 된다.

윈도우의 다이렉트쇼 필터
<화면 1>은 마이크로소프트 다이렉트X의 하부 시스템인 다이텍트쇼(DirectShow) 기반의 코덱 작동을 테스트할 수 있는 그래프에디트(GraphEdit)라는 프로그램을 통해 동영상 파일이 어떻게 재생되는지 테스트해 보는 장면이다. 마치 전자 회로도를 연상시키는 비주얼한 다이어그램으로 보여준다.

<화면 1> 그래프에디트

◆ DivX Movie.avi : 프로그램에서 불러올 동영상 파일이다.
◆ AVI Splitter : AVI 소스 필터이다. 앞에서 설명했듯이 AVI 압축 형식이 아니고 압축된 영상, 음성의 데이터를 담는 그릇에 해당하는 컨테이너이다. AVI Splitter를 통해 압축된 영상과 음성 데이터가 추출된다. 여기서는 Stream 00으로 영상 스트림이, Stream 01로는 음성 스트림이 나온다. 경우에 따라서는 여러 개의 음성 스트림이 포함될 수 있다.
◆ ffdshow MPEG-4 Video Decoder : 오픈소스로 개발되고 있는 DivX 코덱이다. DivX뿐만 아니라 XviD 등 다양한 압축 형식을 디코딩할 수 있다.
◆ Video Renderer : 화면에 표시해 주기 위해서 디스플레이 드라이버와 연결된다. 시스템 설정에 따라서 Overlay나 VMR Renderer가 연결되기도 한다.
◆ ACM Wrapper : 실제 음성 코덱과 연결시키기 위한 Audio Codec Manager이다.
◆ AC3Filter : AC3(Dolby Digital) 멀티채널 오디오를 디코딩하기 위한 코덱이 연결되었다.
◆ Default DirectSound Device : 음성 재생을 위한 사운드카드 드라이버와 연결되는 지점이다.

동영상 파일로부터의 다이렉트쇼 필터(DirectShow Filter) 형태로 만들어진 코덱의 연결은 자동으로 이뤄지는데, 그 연결 상태를 보면 현재 시스템에 재생을 위한 코덱이 정상적으로 설치가 되어 있는지, 원하는 코덱으로 디코딩 가능한지 살펴볼 수 있다. 그런데 여기서 동영상 제작에 쓰인 코덱의 형태에 따라서 자동으로 연결된다는 것이 좋은 점도 있지만 문제를 만들기도 한다. 왜냐하면 통합 코덱의 설치 등으로 시스템에 여러 가지 종류의 코덱이 설치되어 있을 때 서로 충돌이 일어나서 제대로 연결이 안 되거나 엉뚱한 코덱이 연결될 수 있기 때문이다. 따라서 이러한 문제를 해결하기 위해서 내장된 코덱을 우선적으로 연결하는 방식으로 호환성을 확보하는 동영상 플레이어도 있다.

동영상 압축 코덱
요즘 동영상 압축에 많이 사용되는 코덱이 어떤 것이 있는지 살펴보자. 크게 최초의 마이크로스프트의 MPEG-4 코덱을 해킹한 DivX 3.x와 DivX 네트웍스의 DivX 4.x/5.x 그리고 오픈소스 진영의 XviD가 있다.

◆ DivX 3.x : 가장 널리 우리에게 알려진 코덱 형식이다. DivX ;-)라는 이름으로도 많이 알려진 코덱으로 마이크로소프트의 MPEG-4 V3를 기반으로 해서 제작된 코덱이다. 다루기가 쉽다는 장점이 있으며 DivX 4에 비해서 약간 속도가 빠르다.
◆ DivX 4 : DivX 네트웍스에 의해서 DivX 3.x와는 별개로 새롭게 개발된 코덱이지만 곧 이은 DivX 5의 개발로 많이 쓰이지는 않는 코덱이다.
◆ DivX 5 : DivX 4에 비해서 많은 기능과 높은 수준의 영상을 보여주는 코덱이다. 또한 합법적으로 사용할 수 있으며 개인 용도로는 자유롭게 사용할 수 있다. 특히 이전 DivX 버전과 호환성을 가지고 있으며 가장 발전된 MPEG-4 기능들을 제공하는 코덱이다.
◆ XviD : 현재는 아쉽게도 개발이 중단된 상태지만 최근 혜성처럼 등장한 새로운 코덱이다. DivX와 마찬가지로 MPEG-4를 기반으로 하는 코덱이며, 합법적으로 사용할 수 있다는 장점이 있다. 알파 버전에서도 상당히 뛰어난 결과를 보여준다. 특히 오픈 소스를 내세우는 코덱이기 때문에 누구나 개발을 통해서 더 나은 코덱으로 발전시킬 수 있는 장점이 있다.
◆ WMV : 마이크로소프트에서 MPEG-2/MPEG-4에 대응하고 스트리밍을 위해 만든 압축 방식이다. 윈도우에 최적화되어 있고 비디오카드의 도움받아 재생시 CPU의 부담을 줄일 수 있다. HD WMV라는 HDTV급(1920x1080 해상도) 포맷도 WMV를 기반으로 하고 있다. <표 1>은 마이크로소프트에서 제공한 WMV와 MPEG-2와의 성능 비교이다.

<표 1> WMV와 MPEG-2와의 성능 비교  

비디오 데이터

MPEG-2 압축(컨텐츠에 따라 다름) 

윈도우 미디어(컨텐츠에 따라 다름) 

압축 절약율 
480/24p 720x480 픽셀/프레임 x 채널당 8비트 x24fps  MPEG-2 @ 4 6 Mbps  WMV Pro @ 1.32Mbps  3:01
480/30i 720x480 픽셀/프레임 x 채널당 8비트 x24fps  MPEG-2 @ 6 8Mbps  WMV Pro @ 24Mbps  2~3:1 
720/24p 1280x720 픽셀/프레임 x 채널당 8비트p x24fps MPEG-2 @ 19Mbps  WMV Pro @ 5~8Mbps 2.4~2.8:1 

동영상 압축 기반 기술
DivX, XviD 등은 정확히 말하면 코덱 개발자들이 붙인 코덱의 명칭이다. 내부적으로 사용된 기술은 MPEG-4를 기반으로 하는 표준 및 기술이 있었기 때문에 가능하다. 관련된 중요한 표준을 알아보자

H.261
H.261은 P가 64kbit/sec의 배수를 나타내는 정수가 있는 P×64로 알려져 있다. H.261은 화상회의 애플리케이션을 목표로 했고 특히 일대일 비디오폰 애플리케이션을 통한 비디오 전송을 목표로 하고 있다. 실제 인코딩 알고리즘은 MPEG 알고리즘과 호환되지 않지만 유사하다. H.261은 실시간 인코딩을 위해 MPEG보다 적은 CPU 점유율이 필요하다. 알고리즘은 동화상에 대한 대역폭 사용을 최적화하는 장치를 포함하므로 빠른 화면 전환에서 상대적으로 정지 화상보다는 화질이 나빠지게 된다. 이렇게 사용되는 H.261은 화질 유지, 가변 비트레이트 인코딩보다는 일정한 비트레이트 인코딩를 유지하게 된다.

H.263
H.263은 낮은 비트레이트 통신을 위해 설계된 ITU-T 표준의 초안이다. 이 표준은 낮은 베트레이트의 애플리케이션만이 아니라 광범위한 비트레이트에 사용된다. H.263은 여러 애플리케이션에서 H.261을 대체할 것으로 기대가 되는데, H.263의 코딩 알고리즘은 H.261과 유사하긴 하지만 성능 개선과 에러 보상을 위해 일부 개선되고 변경됐다. H.263은 다섯 가지 해상도를 지원한다. H.261이 지원하는 QCIF와 CIF 외에 SQCIF, 4CIF, 16CIF가 있다. SQCIF는 QCIF의 해상도의 약 절반 정도이다. 4CIF와 16CIF는 CIF 해상도의 4배와 16배이다. 4CIF와 16CIF를 지원한다는 것은 MPEG 표준과 같은 고비트레이트 표준과 비견된다는 것을 의미한다.

MPEG-2
MPEG-2는 고해상도 비디오와 성능이 개선된 오디오를 지원하는 것을 포함해 MPEG-1을 확장한 것이다. MPEG-2의 목표 비트레이트는 방송용 화질의 풀스크린 비디오를 제공하는 4~15Mbits/s이다. MPEG-2의 초안 표준은 확장성을 제공하는 것이다. MPEG-1과 비교해 인코드/디코드에 더 고가의 하드웨어가 필요하다. 또한 MPEG-1과 같은 이유로 손실에 의한 화질 저하가 되기 쉽다. MPEG-1은 CD-ROM에서 재생하는 데 적합하고 MPEG-2는 고화질로 저장된 애플리케이션과 TV 방송용 애플리케이션에 적합하다. 위성방송의 경우 MPEG-2는 현재 하나의 아날로그 채널이 사용하는 것과 같은 대역폭으로 화질의 손상 없이 5개 이상의 디지털 채널을 인코딩할 수 있다. 이런 주요한 이점에 비하면 인코딩 비용이 많이 들어가는 것은 사실 중요한 것이 아니다. 그러나 현재의 컴퓨터나 인터넷 인프라스트럭처용으로는 MPEG 기반의 솔루션은 비용이 너무 많이 들고 많은 대역폭이 필요하다. 이는 인터넷을 염두에 두고 설계된 것이 아니기 때문이다.

MPEG-4
MPEG-4는 매우 높은 압축 효율을 얻음으로써 매우 낮은 비트률로 전송하기 위한 것이다. 예를 들면 64KB/s 이하 비트레이트의 화상회의를 위해 적합한 압축 형태를 제공하기 위한 것이다. MPEG-4는 시청각 화면을 서로 다른 네트워크에서의 다중 전송을 가능하게 하는 AVOs 또는 Audio/Visual Objects로 분할하는 데 기반을 둔 것이다. MPEG-4의 구조는 현재 MSDL(MPEG-4 Syntactic Description Language)라는 언어에 초점을 맞춰 개발 중이다. MSDL을 사용해 애플리케이션을 더 기본적인 컴포넌트로 구성하고 인터넷에서 이런 컴포넌트를 쉽게 다운받을 수 있도록 새로운 코덱으로 구성할 수 있다.

음성 압축 코덱
컴퓨터에서 재생되는 모든 소리는 아날로그 신호가 디지털화된 것이며 우리가 자주 볼 수 있는 wav 파일은 이런 디지털 음향 파일의 본보기이다. 44.100KHz, 16비트, 스테레오 채널로 디지털화된 Wav 파일은 분당 10MB 이상을 차지하는 고용량이 된다. 따라서 실용적으로는 작은 용량의 파일이 필요하다. 이런 요구에 발맞춰 고음질, 저용량의 파일 압축 방식이 개발됐고 이에 따라 탄생하게 된 것이 MP3와 같은 오디오 압축 파일이다.

MP3
MPEG-1 Layer 3의 줄임말인 MP3는 고품질, 고능률 스테레오 부호화를 위해 MPEG(Moving Picture Experts Group)에서 동영상 부호화와 병행해 표준화한 압축 포맷으로, 가장 애용되고 있는 디지털 포맷이다. MP3의 경우 최근 나오고 있는 다른 디지털 포맷과 달리 복제 방지에 대한 규제 장치가 특별히 없다. 압축 코덱도 공개되어 있고 인코더와 디코더도 쉽게 구할 수 있기 때문에 오디오 압축의 표준으로 자리잡고 있다. CD 포맷이 44.100KHz, 16비트, 스테레오 채널을 따르기 때문에 MP3도 CD 수준의 음질을 얻기 위해서는 128Kps/s, 44.100KHz, 스테레오 채널 혹은 조인트 채널로 압축해야 한다. 현재 MP3는 대부분의 음악 재생 프로그램에서 지원하고 있다. 대부분의 MP3 파일은 128Kbps/s의 정도의 품질로 압축된다.

MPEG-2 AAC
MPEG-2 AAC 포맷은 국내에서는 MP4라고 알려져 있는데 MP3의 상위 개념으로 이해되기 위해서 그렇게 이름지어진 것으로 보인다. 정식 명칭은 MPEG-2 AAC(Advanced Audio Coding)이다. 또는 MPEG-2 NBC(Non Backwards Compatibility)라고도 부른다. MPEG-2 AAC는 MPEG-2 MP3와는 달리 프레임 단위로 데이터를 저장하며 그로 인해 최대 30%까지 용량이 줄어들고 양자화 보절 기술인 TNS와 보정 수치 기억 기술인 예측(pridiction) 기법을 통해 향상된 음질을 제공한다. 결정적으로 MP3는 저작권 문제를 해결하지 않고 대중화되어 음반 업계의 골칫덩이가 되고 있지만 MP4는 처음부터 저작권 복제방지 시스템을 채택해 저작권 문제를 해결했다. 어느 일본의 디지털 위성 방송의 음성 압축 코덱으로 사용된다.

RA
MP3와 비견될 만한 대표적인 음악 압축 포맷인 RA는 인터넷 미디어 스트리밍 분야에서 두각을 나타내고 있는 리얼네트웍스에서 발표한 음향 압축 스트리밍 파일이다. RA의 경우 고압축율을 우선시하기 때문에 MP3와 달리 고 음질을 얻을 수 없다. 따라서 최근에 인터넷 속도가 급속도로 빨라짐에 따라 고압축률보다는 고음질을 선호하는 사용자들의 기호 변화에 따라서 사양길에 들어선 포맷이라고 할 수 있다. RA를 만들 수 있는 프로그램은 CD Streamer와 Real Encoder 등이 있다.

AC3
AC3는 기존의 MP3나 AAC와는 다른 개념의 오디오 포맷이다. MP3나 AAC의 경우 2채널에 기반을 둔 압축 포맷이지만 AC3의 경우 돌비연구소에서 개발한 5.1 채널을 기반으로 하는 입체음향 지원 포맷이다. 기존의 4채널 서라운드 시스템이 좌우, 중앙, 후방에 총 4개의 스피커를 사용하는 것에 비해 AC3는 전후, 좌우, 중앙에 설치하는 5개의 스피커와 중저음대역 전용의 서브 우퍼 스피커를 포함한 총 6개의 스피커 시스템을 지원한다. AC3가 기존 아날로그 방식의 서라운드 시스템에 대해 가지는 가장 큰 차이점은 각 채널이 완전히 분리되어 신호간섭이 없이 깨끗한 소리를 전달할 수 있다는 것이다. 그러나 AC3는 각 채널 하나하나의 음질이 현재의 CD보다 떨어지는 단점을 갖고 있다. 이 때문에 돌비연구소에서도 AC3를 음악용보다는 영화의 사운드 트랙용으로 권하고 있다. AC3는 레이저디스크 플레이어(LDP)와 DVD 등 디지털 매체의 표준 포맷으로 되어 있으며, DVD의 영화를 입체감 있게 보려면 AC3 기능이 내장된 오디오 기기를 연결해야 한다. 사실 AC3의 정식명칭은 돌비 디지털(Dolby Digital)이지만 개발 프로젝트명인 AC3를 아직도 혼용해서 쓰고 있다.

DTS
DTS는 ‘Digital Theater Systems’의 약자로서 원래는 극장용 포맷으로 개발되어 스티븐 스필버그의 ‘쥬라기 공원’에서 처음으로 선보였으며 현재 전 세계 1만 8000개 극장에 DTS 시스템이 설치되어 있을 정도로 시장에서 어느 정도 성공을 거두었다. DTS 음향시스템은 돌비 디지털처럼 다운믹싱을 통한 기존 스테레오 시스템과의 호환성은 없다.

DTS와 DD의 차이
두 포맷간의 가장 큰 차이는 데이터 압축율이다. 돌비디지털은 평균적으로 384kbps의 전송율을 가지며 DTS는 1.4Mbps의 전송율을 갖는다. DTS가 돌비 디지털보다 압축율이 4배 정도 낮은데 이것은 DTS 시스템이 저장 매체의 공간을 많이 차지한다는 측면에서는 단점일 수 있지만, S/N비가 높은 재생이 가능하고 다이내믹 레인지가 넓고 분리도가 좋다는 것 등 치밀하고 웅대한 공간 표현이 가능하다. 그러나 DTS 사운드가 DD나 MP3 사운드보다 무조건 좋다는 편견은 잘못되었다. 모든 미디어에는 원본 불변의 법칙이 적용되기 때문에 얼마나 좋은 소스를 얼마나 잘 인코딩했는가에 따라서 더 큰 차이가 있다. 재생 환경이 얼마나 최적화되어 있는가에 따라서도 큰 차이가 있다. 하지만 심리적으로는 DTS가 DD보다 좋아보이는 것이 사실이기 때문에 최근에는 DVD로부터 DivX를 만들 때 DTS를 포함해서 많이 만들고 있다.

WMA
마이크로소프트에서 MP3와 돌비 디지털에 대응하고 스트리밍을 위해 만든 압축방식이다. 무손실 압축도 지원하기 때문에 CD의 음질을 손상시키지 않고 적은 용량으로 압축할 수 있으며 손실 압축시에도 동일한 용량에서의 MP3보다 더 좋은 음질을 지닌다. 최근에는 5.1 또는 7.1채널을 지원하기 때문에 HD WMV에 멀티 채널 WMA를 이용해서 고품질의 HD급 동영상 컨텐츠 제작에 사용될 수 있다. 다음은 마이크로소프트에서 제공한 DD와 WMA의 성능 비교이다.

<표 2> DD와 WMA와의 성능 비교  
오디오 데이터  돌비 디지털(컨텐츠에 따라 다름)  윈도우 미디어(컨텐츠에 따라 다름)  압축 절약율 
2 ch x 48KHz x 20bits  Dolby Digital 2.0 @ 220Kbps  WMA Pro @ 128Kbps  1.7:1 
6 ch x 48KHz x 20bits  Dolby Digital 5.1 @ 384Kbps  WMA Pro @ 192~256Kbps  1.5~2:1 
6 ch x 48KHz x 24bits  DTS 5.1 @ 1,536Kbps  WMA Pro @ 768Kbps  2:01

MPEG 기술을 둘러싼 특허 이슈
DivX의 출발 자체가 마이크로소프트의 MPEG-4 코덱 파일의 해킹으로부터 시작됐고 MPEG-4 기술이라는 것이 아직도 개발 중이고 특허권 역시 분산되어 있다. 따라서 소프트웨어 개발 업계에서는 DivX라든가 MPEG-4의 특허료에 대해서는 무신경한 것이 사실이다. 그러나 MPEG 기반 기술의 특허권과 라이선스를 대행하는 MPEGLA(http://www.mpegla.com)가 지난 5월 MPEG4 AV/C 특허료를 확정했다. 그 내용은 세트 장비 업체는 앞으로 MPEG4 AVC를 사용하는 특허료로 대당 0.20달러, 컨텐츠 제공업체는 동영상 개당 가격의 2%를 특허료로 지불해야 한다.

또 방송 사업자는 엔코더당 2500달러를 특허료로 제공해야 한다. 이 결정 내용에 따르면 미국 MPEGLA는 MPEG4 AVC를 사용하는 모든 재생 장치와 압축 장치는 물론, PPV·VOD를 비롯한 동영상 컨텐츠, 유무료 방송에 이르기까지 광범위한 영역에 걸친 로열티로 대당 금액 및 부과 비율을 정해놓고 있다. 이에 따라 MPEG4 AVC를 사용하는 장비 제조업체는 물론 인터넷, 모바일 컨텐츠 제공업체, 위성 및 케이블 서비스 업체 등 서비스 매체들도 모두 로열티 부과 대상이 될 전망이다.

국내에서는 방송·통신 융합 매체인 위성 디지털 멀티미디어방송(DMB)과 지상파 DMB가 동영상 압축 기술로 MPEG4 AVC를 채택하고 있으며 향후 인터넷을 포함한 다수의 매체가 사용할 계획이다. 우선 세트 제조업체의 경우 MPEG4 AVC 관련한 인코더/디코더 및 이를 포함하는 제품의 로열티로 연간 판매 대수를 기준으로 각각 무료(10만대 이하), 0.20달러(10만∼500만대), 0.10달러(500만대 이상)를 지불해야 한다. 즉, MPEG4 AVC가 들어간 모든 하드웨어가 적용 대상인 셈이다. 세트 제조업체에 대한 로열티는 내년 1월부터 적용되며 로열티는 업체당 연간 최대 350만 달러(2005∼2006년), 425만 달러(2007∼2008년), 500만 달러(2009∼2010년)를 넘을 수 없다.

눈길을 끄는 부분은 서비스 업체에 대한 로열티다. MPEGLA 측은 유료 컨텐츠·서비스 제공업체가 VOD, PPV, 다운로드 서비스 등의 형태로 사용자에게 동영상을 제공할 시 개당 가격의 2%나 동영상 컨텐츠당 0.02달러를 지불하도록 정했다. 단, 12분 이하인 동영상은 무료다. 또한 개당 컨텐츠 판매가 아닌 가입자를 위한 정액 서비스를 하는 경우에는 연간 단위로, 각각 무료(가입자 수 10만명 이하), 2만 5000달러(10만∼25만 명), 5만 달러(25만∼50만 명), 7만 5000달러(50만∼100만), 10만 달러(100만 이상)를 지불해야 한다.

무료 방송에 MPEG4 AVC를 사용하는 방송국은 초기 방송 시스템 구축시 구매한 인코더 수량 대당 2500달러를 일시불로 지불할 수 있다. 연간 지불을 택할 경우 2500달러(시청 가능 수신기 보급 10만∼50만 미만), 5000달러(50만∼100만 미만), 1만달러(100만 이상)를 지불해야한다. 단지, 무료 인터넷 방송의 경우 2010년까지 로열티를 부과하지 않을 방침이다. 서비스업체에 대한 로열티는 2006년 1월부터 적용되며 연간 350만 달러(2006년∼2007년), 425만 달러(2008년∼2009년), 500만 달러(2010년)를 넘을 수 없다.

따라서 조만간 오픈소스로 개발되고 있는 MPEG-4 기반의 각종 코덱과 그것을 사용하는 소프트웨어와 하드웨어에도 MPEG 라이선스료를 생각하지 않을 수 없을 것이다. 물론 아직 비상용 소프트웨어에 대한 MPEG 라이선스에 대한 어떠한 것도 정립된 단계는 아니지만, MPEGLA가 강경하게 나온다면 지금은 공짜로 사용할 수 있는 동영상 플레이어를 유료로 구입해야 할지도 모른다. 또한 서두에 언급한 것처럼 컨텐츠를 제작하고 배급하는 회사로부터의 DivX 영화에 대한 강력한 규제가 현실화된다면 DivX라는 공룡이 멸종될지도 모르겠다. 그러나 공룡이 멸종한 후에 인류가 탄생했듯이 디지털 멀티미디어의 세상은 영원할 것이다. @

* 이 기사는 ZDNet Korea의 자매지인 마이크로소프트웨어에 게재된 내용입니다.

arrow 트랙백 | 댓글



[PREV] [1][2][3][4][···][18] [NEXT]
관리자  |   글쓰기
BLOG main image
- 블로그를 처음 만들면서
분류 전체보기 (142)
기술동향 뉴스 (51)
신조어 사전 (1)
기술용어집 (5)
영상처리 기술 (29)
영상부호화 (18)
3DAV (5)
영상처리 (3)
모바일 영상 (3)
IT 사용정보 (7)
프로그램 기술 (23)
학술정보 (1)
생활정보 (9)
낙서장 (13)
나의 이야기 (0)
About Me (0)
Total :
Today :
Yesterday :
rss
위치로그 : 태그 : 방명록 : 관리자
multimedia's Blog is powered by Daum / Designed by plyfly.net