본문 바로가기

TechLog

미디어 스트리밍의 역사와 온라인 TV(connected TV)의 미래

자체 스터디 겸 최근 스트리밍 미디어 분야에서의 기술적 흐름을 설명한 글을 찾다가, 괜찮은 내용이라 생각되어 간단히 옮겨 봅니다. 원문은 가디언지에 2013년에 게재되었던 내용입니다.



원제: A history of media streaming and the future of connected TV



미디어 스트리밍의 역사와 온라인 TV(connected TV)의 미래

우리는 온라인 TV의 대규모 도입의 도화선이 될 HD 스트리밍의 보급을 눈앞에 두고 있다. Alex Zambelli가 현재까지 스트리밍 미디어 분야에서 일어났던 일을 여기 정리했다.

Alex Zambelli
2013년 3월 1일 금요일


1995년 9월 5일, ESPN SportsZone은 시애틀에 기반을 둔 Progressive Networks라는 이름의 스타트업이 개발한 최신 기술을 사용해서 시애틀 마리너즈와 뉴욕 양키즈의 야구 경기 라디오 실황을 전세계에 중계했다. 이 라디오 방송은 세계 최초의 스트리밍 방송이었다. 몇 년 후 Progressive Networks는 회사 이름을 RealNetworks로 변경하였고, 훗날 이 회사는 스트리밍 미디어라는 새로운 기술 분야에서 우위를 점하기 위해 Microsoft와 기술적 경쟁과 법적 공방을 벌이고, 결국 쓴 맛을 보게 된다. 인터넷에서의 스트리밍 미디어에 대한 전망은 언제나 IT 애호가와 CEO들을 흥분시켰지만, 초창기 스트리밍 미디어는 어떻게 하면 56k 모뎀 회선으로 볼만한 비디오를 전송할 수 있을지 같은 실용적인 문제에 부딪혀 있었다. Microsoft는 Windows Media 기술에 힘입어 RealNetworks를 물리치고 승자가 되어 전면에 나서는데 성공했지만, 그 승리를 계속 누리지는 못했다. Microsoft가 기회를 살리지 못하고 어물거리는 동안, Macromedia(후일 Adobe Systems에 의해 인수된다)는 느리지만 확실하게 Windows Media의 시장 점유율을 잠식해서 2000년대 중반 즈음에는 급속히 대중화된 Flash Player가 그 자리를 대신하게 된다. Flash는 상호작용성, Web 2.0, 스트리밍 미디어를 최초로 매끄럽게 통합함으로써 스트리밍 미디어 산업을 뒤흔들었다. 스트리밍 미디어의 새로운 시대가 도래했으나, 대역폭, 확장성, 접근성 등 오래된 문제는 여전히 해결되지 않았다.

2000년대 중반까지 대부분의 인터넷 트래픽은 HTTP 기반이었고, CDN은 대중적인 컨텐츠를 수많은 이용자에게 확실히 전달하기 위한 용도로 급속히 성장중이었다. 스트리밍 미디어 기술은 각 회사의 전용 프로토콜(대중적이던 UDP와도 대부분 거리가 먼)만으로는 요구를 충적하기 어려웠다. 2007년 Move Networks라는 이름의 회사는 스트리밍 미디어 산업을 다시 한 번 뒤바꿔 놓을 기술을 내놓았다. 그것은 HTTP 기반 적응형 스트리밍(HTTP-based adaptive streaming)이었다.

특정 회사의 전용 스트리밍 프로토콜에 의존하여 사용자들을 그때그때 인터넷 대역폭의 상황에 맡겨버리는 대신, Move Networks는 대중적인 HTTP 프로토콜을 사용해 미디어를 작은 파일 조각들로 나누어 전송하는 방식을 택했다. 플레이어 응용 프로그램에서 다운로드 속도를 측정하여 시시각각 변하는 네트워크 상황에 따라 전송할 파일 조각의 품질(즉, 파일의 크기)을 선택하도록 하는 것이다. 이 기술은 큰 반향을 일으켰다. 그도 그럴 것이, 이 기술은 스트리밍 미디어를 표준 HTTP를 사용해 광범위하게 CDN에 배포할 수 있도록 해 주었으며, 효율성을 위해 캐시를 할 수도 있었고, 사용자측에서 발생하는 짜증스러운 버퍼링과 연결 문제를 해소해 주었다. 다른 HTTP 기반의 적응형 스트리밍 솔루션들이 곧 그 뒤를 이었다: Microsoft는 2008년에 Smooth Streaming기술을 발표했고, 같은 해에 Netflix는 Watch Instantly 스트리밍 서비스를 위한 자체 기술을 개발했다. 2009년에 Apple은 iOS 기기에 비디오를 전송하기 위해 설계한 HLS(HTTP Live Streaming)를 발표했고, Adobe는 2010년에 HDS(HTTP Dynamic Streaming)으로 이 대열에 합류했다. HTTP 기반의 적응형 스트리밍은 고화질 라이브 스트리밍 이벤트(밴쿠버, 런던 올림픽, 윔블던, Felix Baumgartner의 성층권 다이빙 등)와 고급형 on-demand 서비스(Netflix, LoveFilm, Amazon Instant Video 등)에 즐겨 쓰이는 기술로 빠르게 정착했다. 이 시기는 스트리밍 미디어에 있어서 청소년기와 같았다. 가능성은 넘쳐났지만, 혼란스럽고 다소 서툴렀다.

성숙의 단계에서 메인스트림의 단계로 진입해가는 산업 분야에서, 독점적인 스트리밍 기술들의 경쟁이 또 일어날 경우 득보다 실이 많으리라는 것은 명백했다. 그리하여, 2009년에 3GPP에서 적응형 스트리밍을 위한 산업 표준을 만들기 위한 작업이 시작되었다. 3GPP의 표준화 작업은 2010년에 ISO/IEC MPEG 워킹 그룹으로 옮겨졌고, 이곳에서 다양한 제안들은 채 2년도 못 되어 초안 상태로 정리되어 승인을 앞두게 되었다. Microsoft, Netflix, Apple을 위시한 50개 이상의 기업과 3GPP, DECEOIPF, W3C 등의 기술 그룹이 이 작업에 참여하였다. 2012년 4월에 Dynamic Adaptive Streaming over HTTP, 통칭 MPEG-DASH라는 이름의 새로운 표준이 만들어졌다. 

2011년이 되자 여러 기업들은 재빨리 MPEG-DASH에 대한 지원을 발표했지만, 검증 없이 표준이 적용되는 일이 종종 있었다. MPEG-DASH의 명세는 너무 넓은 범위를 다루려 했고, 그 결과 심히 모호한 명세가 되고 말았다. (HTML5 비디오를 도입하려 시도해 본 사람에게는 친숙한 이야기일 것이다) MPEG-DASH에 참여한 기업들은 DASH의 도입을 촉진하고 상호간의 운용에 대한 규약을 정리하고자 하는 것을 목표로 하는 DASH 산업 포럼을 재빠르게 조직했다. 2011년 초에 DASH-IF는 DASH264 구현 가이드라인의 version 0.9 초안을 내놓고, 커뮤니티 리뷰를 위해 공개했다. (피드백 기한은 2013년 3월 15일까지였다) 그 이름대로, DASH264 가이드라인은 상호운용성에 필요한 중요 사항들에 대한 내역을 제공하고 있다. 예를 들어, 이 가이드라인에는 H.264 비디오 코덱 지원에 대한 내용이 포함되어 있는데, 이 비디오 코덱은 지난 수년 간 산업 표준의 역할을 해 왔다. 그 외에도 상호운용성을 위한 기본적인 사항들 - HE-AAC v2 오디오 코덱, ISO 기반 미디어 파일 포맷, SMPTE-TT 자막 포맷, 컨텐트 보호를 위한 MPEG Common Encryptions(즉, DRM) - 이 포함되어 있다. 이 중 Common Encryption은 특히 흥미로운데, 이 기술은 사용자들이 특정한 디지털 상점에 발이 묶이지 않고도 Microsoft PlayReady, Adobe Access, Widevine과 같은 DRM 기술들이 서로 경쟁할 수 있는 발판을 마련해준다. DASH264는 스트리밍 미디어 산업에서 절실하게 요구하고 있는 세부 내용들을 제공하여, 향후 1~2년 사이 MPEG-DASH를 도입하는데 눈에 띄는 견인차 역할을 할 수 있을 것으로 기대되고 있다.

상호운용성을 제외하고, 스트리밍 미디어와 OTT 방송(over-the-top, VOD, IPTV와 같이 방송 사업자의 개입 없이 ISP에서 직접 컨텐츠를 제공하는 형태의 서비스)이 직면한 큰 장애물 중 하나는 방송 품질이다. 불과 몇 년 사이에 스트리밍 미디어 기술은 SD 비디오에서 720p HD 비디오로 도약했지만, 최고의 VOD OTT 서비스들조차도 방송 품질이 여전히 TV 방송과 블루레이 비디오의 품질에 미치지 못하고 있다. 예를 들어, 위성(DVB-S2)를 통해 송출되는 대부분의 HD 비디오는 17~37Mbps의 H.264 코덱으로 압축된 1080i 비디오인 반면, 대부분의 HD 스트리밍 비디오는 3~4Mbps에 불과한 720p 급 영상이다. TV 방송은 유럽의 경우 50Hz로 송출되고 있지만, 스트리밍 비디오는 유럽에서는 그 절반인 25Hz, 북미에서는 30Hz로 송출되고 있다. 마지막으로, 오디오 방송은 보통 오늘날 5.1 서라운드로 송출되고 있으나, 스트리밍 오디오는 여전히 대부분 스테레오로 송출되고 있다. (가끔 모노인 경우도 있다)

진정 OTT가 전통적인 미디어 전달 방식에 도전하려면 아직 극복해야 할 품질 문제가 존재하지만, 다행히 희망이 보이고 있다. 디지털 미디어의 품질은 일차적으로 대역폭에 영향을 받기 때문에 두 가지 확실한 방법으로 품질을 향상시킬 수 있다: 대역폭을 증가시키거나 압축 효율을 향상시키거나. 전자는 전반적인 인터넷 대역폭의 증가가 필요하지만, 후자는 새로운 코덱 기술을 통해 품질을 향상시킬 수 있다. 10년 전 H.264를 만들었던 ISO/IEC MPEG과 ITU는 최근 성공적인 공동 작업을 통해 최신의 코덱 기술인 H.265를 만들었다. 2013년 초에 ITU는 검증 과정을 거쳐 H.265가 기존 H.265에 비해 40~45% 향상된 압축 효율(혹은 대역폭 감소)을 보인다고 발표하였다. 이러한 압축 효율의 증가는 스트리밍 미디어 공급자가 대역폭을 더 늘리지 않고도 기존의 720p 비디오 송출에 사용되던 회선과 동일한 3~4Mbps 급 대역폭으로 1080p (Full HD) 비디오를 송출하거나, 프레임 비율을 50/60로 늘릴 수 있도록 해 준다. 사실 많은 이들이 H.265의 등장을 4K 비디오 시대의 도래로서 환영하고 있으며, 최종적으로는 스트리밍 비디오의 품질이 현재 느린 행보를 보이는 방송 표준을 추월할 날도 어쩌면 올지 모른다.

꿈꾼다고 안 될 것은 없잖은가?


Alex Zambelli은 iStreamPlanet의 principal video specialist이다.