Videosoftware voor consumenten en professionals zijn steeds meer uitgerust met een goede mpeg-2-encoder. Men kan er ook niet meer omheen. Standaarden als dvd, hdtv, maar ook de meeste televisie-uitzendingen in Hilversum worden uitgezonden in mpeg-2. Encoderen met mpeg-2 lijkt ingewikkeld, maar wie de werking van de encoder begrijpt komt een heel eind.
Een platformonafhankelijke standaard voor digitale compressie van audio- en videosignalen. Dat is waarop de wereld rond 1988 met smacht zat te wachten. Natuurlijk bestond er al videocompressie, maar net zoals met de internet-browsers, streden ook hier verschillende partijen om de hegemonie. Dat hierbij niet gekeken werd naar het algemeen belang, kwam voort uit de enorme winsten die met nieuwe ontwikkelingen en de licentieverkoop daarvan konden worden geboekt. In 1988 werd de MPEG (Moving Picture Expert Group) opgericht met als doel een standaard te ontwikkelen voor digitale compressie van video en audiosignalen. Vijf jaar later werd de eerste standaard, mpeg-1, werkelijkheid. Mpeg-1 beschrijft een codingsschema waardoor audio- en videosignalen kunnen worden gecodeerd en afgespeeld. De doorvoersnelheid van mpeg-1 is maximaal 1,5 Mbit per seconde met een resolutie van 352 x 288, afdoende om video af te spelen op een cd-rom. De kwaliteit is te vergelijken met een vhs-band, acceptabel maar verre van perfect. Een tweede mpeg-versie was noodzakelijk om ook video te kunnen encoderen voor standaard televisie-uitzendingen. In 1995 werd mpeg-2 officieel een feit en daarmee werd het startsein gegeven aan de industrie om aan de slag te gaan om applicaties, hardware en software te ontwikkelen die mpeg-2 zouden gebruiken.
HDTV
De ontwikkelaars van mpeg zagen hun dromen de volgende jaren boven verwachting uitkomen. Mpeg-2 werd door iedereen omarmd. Eindelijk was er een platform onafhankelijk compressie methode. Mpeg-2 is nu de standaard voor het encoderen van dvd's, het uitzenden van digitale televisie en is de compressie methode voor High Definition Television (HDTV). De kracht van mpeg is dat het een encoderingssysteem is dat gebruikt kan worden voor verschillende applicaties. Omdat de omvang van de encoder te groot wordt als alle functionaliteit wordt benut is deze op te delen in verschillen profielen (Profiles) en niveaus (Levels). (Zie kader.) De profielen geven aan welke algoritmes er moeten worden gebruikt en de niveaus specificeren de eigenschappen daarvan zoals bitrates en afmetingen. Afhankelijk van de apparatuur of de beschikbare bandbreedte kan men nu een keuze maken welke delen van de encoder men wil implementeren.
De werking van mpeg-2
Om de werking van mpeg-2 te kunnen begrijpen, moeten de basisbeginselen van televisie en video duidelijk zijn. Televisie maakt gebruikt van interlaced beelden. Dit betekent ieder beeld dat we zien is opgebouwd uit twee velden. Het eerste veld laat 25 oneven beeldlijnen zien. Als deze zijn getoond, wordt het tweede veld, met de 25 even beeldlijnen, tussen de oneven beeldlijnen gezet. Samen vormen ze dan één videoframe. Er gaan 25 frames in één seconden met een beeldresolutie van 720 x 576 pixels, de standaard voor het PAL-signaal.
Apparatuur als computermonitoren en handhelds laten geen interlaced beelden zien. Het beeld bestaat hier uit één frame zonder velden. Deze beelden worden progressive videobeelden genoemd. In tegenstelling tot mpeg-1 dat ontwikkeld is voor het encoderen van progressive videobeelden, kan mpeg-2 zowel interlaced als non-interlaced beelden encoderen. Televisies en monitoren geven videobeelden weer in een rgb-kleurruimte. Behalve de kleuren zit er in dit rgb-signaal ook de helderheidinformatie van het beeld verweven. In ongecomprimeerde vorm zou het rgb-signaal te omvangrijk zijn om te kunnen uitzenden. Een reductie van de video bitrate is eenvoudig te bewerkstelligen door de hoeveelheid kleuren in het rgb-signaal te verminderen. De keuze voor het verminderen van de hoeveelheid kleuren komt voort uit het feit dat het menselijk oog gevoeliger is voor helderheid- dan voor kleurverschillen.
Uitzendnorm
Om de helderheidinformatie los te koppelen van de kleuren wordt het rgb-signaal om gezet naar een Y, R-Y, B-Y signaal. Hierbij staat Y voor de helderheid en vormen de R-Y en B-Y de afzonderlijke kleurkanalen. Het groen uit rgb is verweven met het Y-signaal.
Na los koppeling kunnen de kleuren afzonderlijk van de helderheid worden verminderd. Dit proces wordt subsampling genoemd. De bekendste subsamples die worden gebruikt zijn 4:2:2 en 4:2:0.
De 4 staat voor de helderheidwaarde van het signaal of Y. Deze blijft onveranderd. De kleuren kunnen nu relatief ten opzicht van de helderheid worden verminderd. In een 4:2:2 subsample worden de kleuren met de helft verminderd. Dit betekent dat er op iedere horizontale beeldlijn 360 pixels van de 720 voorzien zijn van de componenten R-Y en B-Y. En dat dit verticaal op iedere beeldlijn wordt herhaald.
Het tweede veel gebruikte subsample is 4:2:0 en is tevens uitzendnorm voor PAL. In een 4:2:0 systeem worden zowel horizontaal als verticaal kleuren verwijderd. Horizontaal wordt er op iedere beeldlijn maar één kleurkanaal gebruikt dus of R-Y of B-Y. Deze wordt vervolgens op 360 pixels van de 720 getoond. Verticaal gebeurt dit om en om. De bitrate van de video is door deze conversie sterk gereduceerd, maar nog steeds zeer omvangrijk. Beelden met een 4:2:2 subsampling hebben een bitrate van 166 Mbit/s en beelden met een 4:2:0 subsampling 124 M/bit/s. Als we dit bijvoorbeeld vergelijken met de maximale bitrate van een dvd (9,8 Mbit/s) moet er nog heel wat gebeuren voordat die compressie is gerealiseerd.
Group of Pictures
De quantisering zorgt er daarna voor dat de verschillende dct-waarden in een matrix worden opgeslagen die voor verdere reductie van de gegevens zorgt. Als laatste stap kijkt de mpeg-encoder naar de verschillende frames waaruit de video is opgebouwd, om ze vervolgens te encoderen. Mpeg-2 maakt gebruik van intra- en interframe compressie. Bij intra-frame compressie wordt alle informatie van een frame geëncodeerd en bij interframe compressie alleen de verschillen tussen de frames.
Bij mpeg-2-compressie worden de videobeelden opgebouwd uit zogenaamde Group of Pictures (GOP). Een GOP bestaat uit I (Intra), B (Bidirectional) en P (Predictive) frames. Een I-frame wordt in zijn totaal geëncodeerd. B-frames kijken naar achterliggende en voorliggende I- en P-frames en slaan de verschillen daartussen op. P-frames slaan alleen de verschillen op met eerdere I- of P-frames.
Deze manier van encoderen zorgt ervoor dat de video moeilijk te bewerken is in videomontagesoftware. Veel frames zijn immers afhankelijk van informatie van andere frames. Als we hierin willekeurig gaan knippen lopen we het risico dat er frames ontstaan zonder referentiekader. Gelukkig wordt montagesoftware steeds intelligenter en het zal een kwestie van tijd zijn voordat alle programma's overweg kunnen met het monteren van mpeg-2. Tot die tijd kunt u er voor kiezen uw originele materiaal te encoderen met alleen maar I-frames. U heeft dan de beste kwaliteit, minder problemen met monteren, maar ook grotere bestanden die moeten worden opgeslagen.
Algemene instellingen
Behalve de wijze waarop u bestanden opslaat zult u ook moeten aangeven in welk videoformaat moet worden geëncodeerd. U heeft de keuze tussen NTSC en PAL. In Nederland gebruiken we het PAL-systeem. Als laatste kunt u een keuze maken voor een audiocodec. Standaard voor een dvd is mpeg-layer 2. Kiest u voor LPCM, dan wordt de audio ongecodeerd op de dvd gezet. Het nadeel van LPCM is dat het veel ruimte in beslag neemt en dat u dus minder ruimte is voor videobeelden.
Video-instellingen
De basis van de video-instellingen wordt gevormd door de 'Frame rate', de manier waarop de velden van een frame worden weergegeven, de aspect ratio en of het beeld moet worden gedeïnterlaced. Voor alle pal-dvd's geldt een 'Frame rate' van 25. In bijna alle gevallen worden de 'Bottom Fields' het eerst getoond. Deze keuze staat altijd als standaard aangegeven. Als alternatief voor de velden kunt u kiezen voor progressive frames. U moet er dan zeker van zijn dat de apparatuur waarop de beelden worden getoond hiermee overweg kan.
De aspect ratio is bepalend voor de manier waarop het beeld wordt weergegeven. De twee voornaamste keuzes zijn 4:3 voor standaard televisie en 16:9 voor breedbeeld. De aspect ratio moet overéénkomen met de manier waarop de beelden zijn opgenomen door de camera. Een 4:3 beeld kan nooit breedbeeld worden tenzij u zwarte balken gebruikt aan de onder- en bovenkant.
Het encodeerproces kan, afhankelijk van de gebruikte encoder, in een aantal stappen worden uitgevoerd. Deze stappen noemen we 'Passes". Hoe meer passes, des te nauwkeuriger er wordt geëncodeerd en des te beter de kwaliteit. Dit betekent ook dat de tijd die nodig is om te encoderen langer duurt.
Als de basisinstellingen zijn bepaald kunt u het 'Bitrate type' gaan bepalen. U heeft de keuze uit Constante en Variabele bitrate. Bij een Constante bitrate wordt er aan iedere scène een constante hoeveelheid bits toegekend. Dit kan problemen opleveren bij complexe scènes. Het gevolg is dat daar de beeldkwaliteit achteruit gaat. Bij een 'Variabele bitrate' bepaald de encoder afhankelijk van de scène of er meer of minder bits moeten worden toegekend. Een optimale kwaliteit-compressie ligt rond de 6000 Kbps. De maximale bitrate mag in ieder geval nooit boven de 9800 Kbps uitkomen.
Als laatste kunt u aandacht besteden aan de 'GOP'. Standaard bestaat een GOP uit 12 frames. Deze GOP is onderverdeeld in één I-frame, 3 P-frames en 8 B-frames. De kwaliteit van het beeld kunt u verhogen door kleinere GOP's te gebruiken. Het gevolg is wel, dat er minder data op de dvd past.
Conclusie
Wie bekend is met de werking en instellingen van mpeg-2, kan er voor zorgen dat het beeld altijd de hoogste kwaliteit heeft en dat er optimaal gebruik wordt gemaakt van de ruimte die een dvd biedt. Daarnaast kan de kennis van de instellingen ook worden gebruikt voor het encoderen in Windows Media en mpeg-4. Deze twee formaten vormen op dit moment de grootste bedreiging voor mpeg-2 in de toekomst omdat deze nog efficiëntere encoderingsschema's hanteren.
Levels & Profiles
De meeste mpeg-encoders kunnen overweg met verschillende mpeg levels en profiles. Een keuze voor de juiste optie is van belang om de video te kunnen laten werken op de gewenste toepassing. De meest bekende levels en profiles heb ik hier op een rij gezet. Het maximale aantal frames per seconde voor PAL is 25. In de tabellen staat 30 omdat mpeg ook rekening houdt met de NTSC standaard. De frame resoluties zijn aanbevolen waarden die werken met de applicaties. Vaak geeft de encoder je de mogelijkheid hiervan af te wijken.
Low profiles en levels
Profile & Level | SimpleProfile@LowLevel | SimpleProfile@MainLevel |
Afkorting | SP@LL | SP@ML |
Chroma formaat | 4:2:0 | 4:2:0 |
Maximum Bit rate | 96 Kbps | 384 Kbps |
Resolutie | 176x144 | 352x288 |
Maximale frame Rate | 15 | 15 |
Toepassing | Mobiele telefonie | PDA's |
Main profiles en levels
Profile & Level | MainProfile@LowLevel | MainProfile@MainLevel | MainProfile@High-1440Level | MainProfile@HighLevel |
Afkorting | MP@LL | MP@ML | MP@HL | MP@HL |
Chroma formaat | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 |
Maximum Bit rate | 4 Mbps | 15 Mbps | 60 Mbps | 80 Mbps |
Resolutie | 352 x 288 | 720 x 576 | 1440 x 1080 | 1920 x 1080 |
Maximale frame Rate | 30 | 30 | 60 | 60 |
Toepassing | Set-top boxen voor televisie | dvd's | HDTV | HDTV |
High profiles en levels
Profile & Level | HighProfile@High-1440Level | HighProfile@HighLevel | HighProfile@MainLevel |
Afkorting | HP@H-14 | HP@HL | HP@ML |
Chroma formaat | 4:2:2 of 4:2:0 | 4:2:2 of 4:2:0 | 4:2:2 of 4:2:0 |
Maximum Bit rate | 80 Mbps | 100 Mbps | 20 Mbps |
Resolutie | 1440 x 1080 | 1920 x 1080 | 720 x 576 |
Maximale frame Rate | 60 | 60 | 30 |
Toepassing | HDTV, studio | HDTV, studio | Studio |
Studio profiles en levels
Profile & Level | 4:2:2Profile@MainLevel |
Afkorting | 422@ML |
Chroma formaat | 4:2:2 of 4:2:0 |
Maximum Bit rate | 50 Mbps |
Resolutie | 720 x 576 |
Maximale frame Rate | 30 |
Toepassing | Studio, Sony IMX tapes |
De officiële mpeg-familie en verwanten
Mpeg-1
Om videomateriaal te encoderen voor gebruik op video-cd's wordt mpeg-1 gebruikt. Deze eerste versie van mpeg is bedoeld voor het encoderen van non-interlaced videomateriaal. De lage bitrate tot maximaal 1,5 Mbit/s geeft een acceptabel beeld dat vergelijkbaar is met vhs-kwaliteit. Mpeg-1 kan maar overweg met videosignaal en is dus niet bruikbaar voor uitzendingen over de satelliet.
Mpeg-2
De opvolger van mpeg-1 heeft heel wat meer functionaliteit in huis. Mpeg-2 kan bitrates halen van 100 Mbit/s. Dit levert een super strak en professioneel beeld op dat geschikt is voor uitzending op hdtv. Mpeg-2 kan overweg met meerdere audio en videosignalen waardoor uitzendingen over de satelliet mogelijk zijn. De opvolger van mpeg-1 is nu al de standaard voor uitzendingen over satelliet, hdtv en dvd en zal dat voorlopig nog wel even blijven.
Mpeg-4
De ontwikkelaars van mpeg wilde meer dan alleen standaarden ontwerpen voor het encoderen van alleen video en audio streams. Mpeg-4 kreeg daarom in 1993 als doel de standaard te worden voor multimediale applicaties. Behalve video en audio moest het ook mogelijk zijn om teksten, synthetische muziek, tekst naar spraak en afbeelding te encoderen en decoderen. Mpeg-4 zou daardoor geschikt zijn voor gebruik op draadloze netwerken, interactieve televisie en mobiele telefoons.
Mpeg-7
Dagelijks worden grote hoeveelheden audiovisueel materiaal beschikbaar gesteld voor gebruik over netwerken. Hoe groter de hoeveelheid, des te lastiger het is om de juiste video- of audiofragmenten te vinden. Mpeg-7 moet hiervoor een oplossing bieden. Deze standaard die in 1996 werd gedeponeerd, beschrijft een raamwerk voor audiovisuele content in multimediale netwerken. Door gebruik te maken van mpeg-7 kunt u de kenmerken van de data beschrijven als ook waar de data te vinden is. Voor mpeg-7 maakt het niet uit met welke codec de data is geëncodeerd.
Mpeg-21
De laatste volledige standaard gedefinieerd door de Moving Pictures Experts Group is mpeg-21. Deze standaard definieert een aantal regels voor het uitwisselen, consumeren, ruilen en transacties als ook de manier waarop gebruikers interactief kunnen omgaan met digitale content. Mpeg-21 is als het ware een multimediaal raamwerk met een aantal afspraken over hoe om te gaan met digitaal materiaal, hun gebruikers en hun verschillende apparatuur.
Microsoft mpeg-4v3
Voortbordurend op de mpeg-4 technologie ontwikkelde Microsoft haar eigen codec. Deze codec heeft de naam Microsoft mpeg-4v3 gekregen. De codec is zo goed dat het de kwaliteit van de originele mpeg-4 codec overtreft. Origineel ontwikkeld voor het streamen van video over lage bandbreedtes, is de codec nu ook geschikt voor het encoderen van high definition video. De gehanteerde compressiemethode is efficiënter dan die van mpeg-2. Microsoft heeft in oktober 2003 aan het dvd-forum gevraagd mpeg-4v3 tot standaard te verheffen voor het encoderen van hd-dvd.
Divx 😉
De Fransman Jerome Rota hackt na het uitkomen van Microsoft mpeg-4v3 de broncode. Hij verandert de parameters voor de resolutie, voegt verschillende audio- en video-codecs toe en zorgt ervoor dat ook avi-bestandsformaten worden ondersteund. Divx 😉 wordt razend populair omdat het gebruikers in staat stelt om complete speelfilms met behoud van hoge kwaliteit te kunnen encoderen voor gebruik op cd-rom.
Rota programmeert enkele jaren later de broncode opnieuw. Nu maakt hij geen gebruik van de Microsoft codec. Deze legale versie van Divx v5 Pro wordt omarmd door de fabrikanten van dvd-spelers, waardoor gebruikers hun geëncodeerde materiaal op televisie kunnen bekijken.
H.264/mpeg-4 AVC
De International Telecommunications Union (ITU) ontwikkelt video-codecs voor gebruik op de lage bitrates. Eén van de doelstellingen van H.264 was een compressie te bereiken die twee maal zo groot was als die van de concurrenten met behoudt van kwaliteit. De ITU maakte daarbij gebruik van de mpeg-4 technologie. De Moving Experts Pictures Group zag het belang in van de ontwikkeling van H.264 en de partijen gingen samenwerken. Dit resulteerde in de meest geavanceerde codec van dit moment, de Advanced Video Codec. Met deze codec is het mogelijk om dvd-kwaliteit video te streamen met zeer lage bitrates.