Kompressionsartefakt - Compression artifact

Originalt billede, med god farvegrad
Tab af kantklarhed og tone "fuzziness" i kraftig JPEG -komprimering

En komprimeringsartefakt (eller artefakt ) er en mærkbar forvrængning af medier (herunder billeder , lyd og video ) forårsaget af anvendelsen af tabende komprimering . Tabt datakomprimering indebærer at kassere nogle af medias data, så det bliver lille nok til at blive lagret inden for den ønskede diskplads eller transmitteret ( streamet ) inden for den tilgængelige båndbredde (kendt som datahastigheden eller bithastigheden ). Hvis kompressoren ikke kan gemme nok data i den komprimerede version, er resultatet et tab af kvalitet eller introduktion af artefakter. Den komprimeringsalgoritme kan ikke være intelligent nok til at skelne mellem fordrejninger af lidt subjektive betydning og dem stødende for brugeren.

De mest almindelige digitale komprimeringsartefakter er DCT -blokke, forårsaget af den diskrete cosinustransformation (DCT) komprimeringsalgoritme, der bruges i mange digitale mediestandarder , såsom JPEG- , MP3- og MPEG -videofilformater. Disse kompressionsartefakter vises, når der anvendes kraftig komprimering, og forekommer ofte i almindelige digitale medier, såsom dvd'er , almindelige computerfilformater som JPEG-, MP3- og MPEG -filer og nogle alternativer til compact disc , såsom Sonys MiniDisc -format. Ukomprimerede medier (f.eks. På laserdiscs , lyd -cd'er og WAV -filer) eller komprimerede medier uden tab (f.eks. FLAC eller PNG ) lider ikke af komprimeringsartefakter.

Minimering af opfattelige artefakter er et centralt mål i implementeringen af ​​en tabende komprimeringsalgoritme. Imidlertid produceres artefakter lejlighedsvis bevidst til kunstneriske formål, en stil kendt som glitch art eller datamoshing.

Teknisk set er en komprimeringsartefakt en bestemt klasse af datafejl, der normalt er en konsekvens af kvantisering i tabende datakomprimering. Hvor transformeringskodning bruges, antager den typisk formen af ​​en af grundfunktionerne i koders transformationsrum.

Billeder

Illustration af effekten af ​​JPEG -komprimering på et lidt støjende billede med en blanding af tekst og mellemrum. Tekst er en skærmoptagelse fra en Wikipedia -samtale med støj tilføjet (intensitet 10 i Paint.NET). Et billede af animationen blev gemt som en JPEG (kvalitet 90) og genindlæst. Begge rammer blev derefter zoomet med en faktor 4 (nærmeste nabointerpolation).

Ved udførelse af blokbaseret diskret cosinustransformation (DCT), der koder til kvantisering , som i JPEG -komprimerede billeder, kan der vises flere typer artefakter.

  • Ringer
  • Konturering
  • Plakater
  • Trappestøj ( aliasing ) langs buede kanter
  • Blokering i "travle" regioner (blokgrænseartefakter, undertiden kaldet makroblokering, quiltning eller skakbræt)

Andre tabsgivende algoritmer, der bruger mønstermatchning til at deduplisere lignende symboler, er tilbøjelige til at introducere fejl, der er svært at opdage i trykt tekst. For eksempel kan tallene "6" og "8" blive udskiftet. Dette er blevet observeret at ske med JBIG2 i visse kopimaskiner.

Blok grænseartefakter

Bloker kodende artefakter i et JPEG -billede. Flade blokke skyldes grov kvantisering. Diskontinuiteter ved transformblokgrænser er synlige.

Ved lave bithastigheder introducerer ethvert tabsbaseret blokbaseret kodningsskema synlige artefakter i pixelblokke og ved blokgrænser. Disse grænser kan transformere blokgrænser, forudsigelsesblokgrænser eller begge dele og kan falde sammen med makroblokgrænser . Udtrykket makroblokering bruges almindeligvis uanset artefaktens årsag. Andre navne omfatter flisebelægning, mosaisering, pixelering, quiltning og skakbræt.

Blokartefakter er et resultat af selve princippet om bloktransformeringskodning . Transformen (f.eks. Den diskrete cosinustransformation) påføres en blok af pixels, og for at opnå tabsfri komprimering kvantificeres transformationskoefficienterne for hver blok . Jo lavere bithastighed, jo mere groft er koefficienterne repræsenteret, og jo flere koefficienter kvantiseres til nul. Statistisk set har billeder mere lavfrekvent end højfrekvent indhold, så det er det lavfrekvente indhold, der er tilbage efter kvantisering, hvilket resulterer i slørede blokke med lav opløsning. I det mest ekstreme tilfælde bevares kun DC-koefficienten, det vil sige koefficienten, der repræsenterer en bloks gennemsnitlige farve, og transformationsblokken er kun en enkelt farve efter rekonstruktion.

Fordi denne kvantiseringsproces anvendes individuelt i hver blok, kvantificerer naboblokke koefficienter forskelligt. Dette fører til diskontinuiteter ved blokgrænserne. Disse er mest synlige i flade områder, hvor der er lidt detaljer for at maskere effekten.

Billedartefaktreduktion

Der er blevet foreslået forskellige tilgange til at reducere billedkomprimeringseffekter, men for at bruge standardiserede komprimerings-/dekomprimeringsteknikker og bevare fordelene ved komprimering (f.eks. Lavere transmissions- og lagringsomkostninger) fokuserer mange af disse metoder på "efterbehandling"-det vil sige , behandling af billeder, når de modtages eller ses. Ingen efterbehandlingsteknik har vist sig at forbedre billedkvaliteten i alle tilfælde; følgelig har ingen opnået udbredt accept, selvom nogle er blevet implementeret og er i brug i proprietære systemer. Mange fotoredigeringsprogrammer har for eksempel proprietære JPEG-artefaktreduktionsalgoritmer indbygget. Forbrugerudstyr kalder ofte denne efterbehandling "MPEG-støjreduktion".

Grænseartefakt i JPEG kan omdannes til mere behagelige "korn", ikke ulig dem i fotografier med høj ISO -film. I stedet for bare at multiplicere de kvantiserede koefficienter med kvantiseringstrinnet Q vedrørende 2D-frekvensen, intelligent støj i form af et tilfældigt tal i intervallet [- Q /2; Q /2] kan føjes til den dekvantiserede koefficient. Denne metode kan tilføjes som en integreret del til JPEG -dekompressorer, der arbejder på billioner af eksisterende og fremtidige JPEG -billeder. Som sådan er det ikke en "efterbehandling" teknik.

Ringeproblemet kan reduceres på kodningstidspunktet ved at overskride DCT -værdierne og spænde ringene væk.

Posterisering sker generelt kun ved lav kvalitet, når DC -værdierne tillægges for lidt betydning. Indstilling af kvantiseringstabellen hjælper.

Video

Eksempel på billede med artefakter på grund af en transmissionsfejl

Når der bruges bevægelsesforudsigelse, som i MPEG-1 , MPEG-2 eller MPEG-4 , har komprimeringsartefakter en tendens til at forblive på flere generationer af dekomprimerede rammer og bevæge sig med billedets optiske strøm , hvilket fører til en ejendommelig effekt, halvvejs mellem en malerieffekt og "snavs", der bevæger sig med objekter i scenen.

Datafejl i den komprimerede bitstrøm, muligvis på grund af transmissionsfejl, kan føre til fejl, der ligner store kvantiseringsfejl, eller kan forstyrre analysen af ​​datastrømmen helt i kort tid, hvilket kan føre til "opdeling" af billedet . Hvor der er opstået grove fejl i bit-stream, fortsætter dekodere med at anvende opdateringer på det beskadigede billede i et kort interval, hvilket skaber en "spøgelsesbillede" -effekt, indtil de modtager den næste uafhængigt komprimerede ramme. I MPEG-billedkodning er disse kendt som " I-frames ", hvor 'I' står for 'intra'. Indtil den næste I-ramme ankommer, kan dekoderen udføre fejlsløring .

Bevægelseskompensation blokerer grænseartefakter

Blokgrænsekontinuiteter kan forekomme ved kanter af bevægelseskompensationsforudsigelsesblokke . I bevægelseskompenseret videokomprimering forudsiges det aktuelle billede ved at flytte blokke (makroblokke, partitioner eller forudsigelsesenheder) af pixels fra tidligere afkodede rammer. Hvis to tilstødende blokke bruger forskellige bevægelsesvektorer, vil der være en diskontinuitet ved kanten mellem blokkene.

Mygstøj

Videokomprimeringsartefakter inkluderer kumulative resultater af komprimering af de omfattende stillbilleder, for eksempel ringning eller anden kant -travlhed i successive stillbilleder fremstår i rækkefølge som en skinnende sløring af prikker rundt om kanter, kaldet mygstøj , da de ligner myg, der sværmer rundt om objektet. Den såkaldte "mygstøj" er forårsaget af den blokbaserede diskrete cosinustransformation (DCT) komprimeringsalgoritme, der bruges i de fleste videokodningsstandarder , f.eks. MPEG- formater.

Reduktion af videoartefakter

Artefakterne ved blokgrænser kan reduceres ved at anvende et deblockeringsfilter . Som ved stillbilledkodning er det muligt at anvende et afblokeringsfilter på dekoderudgangen som efterbehandling.

I bevægelsesforudsagt videokodning med en lukket forudsigelsessløjfe bruger encoderen dekoderudgangen som forudsigelsesreferencen, hvorfra fremtidige rammer forudsiges. Til dette formål integrerer encoderen konceptuelt en dekoder. Hvis denne "dekoder" udfører en deblockering, bruges det blokerede billede derefter som et referencebillede til bevægelseskompensation, hvilket forbedrer kodningseffektiviteten ved at forhindre en spredning af blokartefakter på tværs af rammer. Dette kaldes et in-loop-deblockeringsfilter. Standarder, der angiver et in-loop-deblockeringsfilter, omfatter VC-1 , H.263 bilag J, H.264/AVC og H.265/HEVC .

Lyd

Tabt lydkomprimering fungerer typisk med en psykoakustisk model - en model for menneskelig høreopfattelse. Tabte lydformater involverer typisk brug af en tid/frekvens domænetransform, såsom en modificeret diskret cosinustransform . Med den psykoakustiske model udnyttes maskeringseffekter som frekvensmaskering og tidsmæssig maskering, så lyde, der burde være umærkelige, ikke optages. For eksempel er mennesker generelt ikke i stand til at opfatte en stille tone, der spilles samtidigt med en lignende, men højere tone. En tabende komprimeringsteknik identificerer muligvis denne stille tone og forsøger at fjerne den. Kvantiseringsstøj kan også "skjules", hvor de ville blive maskeret af mere fremtrædende lyde. Med lav kompression bruges en konservativ psy-model med små blokstørrelser.

Når den psykoakustiske model er unøjagtig, når transformationsblokstørrelsen er begrænset, eller når aggressiv komprimering bruges, kan dette resultere i kompressionsartefakter. Komprimeringsartefakter i komprimeret lyd viser sig typisk som ringetoner, præ-ekko , "birdie-artefakter", drop-outs, rasling, krængning, metallisk ringning, en undervandsfølelse, hvæsende eller "kornethed".

Et eksempel på komprimeringsartefakter i lyd er bifald i en relativt stærkt komprimeret lydfil (f.eks. 96 kbit/sek MP3). Generelt har musikalske toner gentagne bølgeformer og mere forudsigelige variationer i volumen, hvorimod bifald i det væsentlige er tilfældigt og derfor svært at komprimere. Et stærkt komprimeret klapsalver kan have "metallisk ringning" og andre komprimeringsartefakter.

Kunstnerisk brug

Video glitch art

Kompressionsartefakter kan med vilje bruges som en visuel stil, undertiden kendt som glitch art . Rosa Menkman 's glitch kunst gør brug af komprimering artefakter , især den diskrete cosinus omdanne blokke (DCT blokke) findes i de fleste digitale medier datakomprimering formater såsom JPEG digitale billeder og MP3 digital lyd . I stillbilleder er et eksempel Jpegs af den tyske fotograf Thomas Ruff , der bruger forsætlige JPEG -artefakter som grundlag for billedets stil.

I videokunst er en anvendt teknik datamoshing , hvor to videoer er indflettet, så mellemrammer interpoleres fra to separate kilder. En anden teknik indebærer simpelthen at omkodning fra et tabsformat videoformat til et andet, hvilket udnytter forskellen i, hvordan de separate videocodecs behandler bevægelses- og farveinformation. Teknikken blev banebrydende af kunstnerne Bertrand Planes i samarbejde med Christian Jacquemin i 2006 med DivXPrime, Sven König, Takeshi Murata , Jacques Perconte og Paul B. Davis i samarbejde med Paperrad , og for nylig brugt af David OReilly og inden for musikvideoer til Chairlift og af Nabil Elderkin i musikvideoen " Welcome to Heartbreak " til Kanye West .

Der er også en genre af internet -memes, hvor ofte meningsløse billeder målrettet komprimeres kraftigt nogle gange flere gange for komisk effekt. Billeder skabt ved hjælp af denne teknik kaldes ofte "friturestegt".

Se også

Referencer

eksterne links