forsideprosjekterreiserhistorie
musikkfotodata
webgrafisklyd og bildeCFDhjemmeserverkomprimering
Komprimere filerI mange sammenhenger finner man plutselig ut at man ønsker å sende eller ta vare på filer, samlet. På folkemunne sies det gjerne at filene skal pakkes, og for den jevne databruker har man hatt muligheten til dette i Windows ved å høyreklikke på filer eller mapper og velge Send til.

Oppmerksomme brukere legger gjerne fort merke til at det finnes alternativer til den mest vanlige pakkede filtypen, ZIP-filene. Grunnen til hvorfor det finnes flere formater er like enkelt å svare på som spørsmålet om hvorfor man kjøper ny sykkel og mobiltelefon; man ønsker gjerne å ha noe som fungerer bra.

For utviklingen har ikke stått stille siden ZIP-filer ble introdusert 1989.

Mange sverger at RAR-filer er et uovertruffent alternativ til ZIP. Men det er ikke nødvendigvis helt sant. Siste skudd på stammen disse dager, innen komprimering, er formatet .xz. Den er basert på LZMA2, som ble tatt i bruk første gang i 2009. I mange sammenhegner finner man ofte filer av typen .lzma eller kanskje helst .tar.lzma — og har lenge vært ansett som (kanskje) det beste formatet av alle.

Så her følger en aldri så liten sammenligning. Prosentanvisningene angir størrelsesforhold til respektive ZIP-fil.

Valgresultat 2009(kilde) zip rar (73%) bzip2 (65%) lzma (48%) xz (49%)
Python 3.1 user guide(kilde) zip rar (93%) bzip2 (61%) lzma (53%) xz (54%)
Wordpress(kilde) zip rar (96%) bzip2 (78%) lzma (71%) xz (71%)

Jeg gjorde også en større test på kildekoden til Firefox, bestående av 16000 filer på tilsammen 300mb. Her kom .xz-varianten ut med 41mb komprimert, mot 92mb for zip, altså en reduksjon på 45% — kun ved å velge riktig komprimeringsmetode.

Det er noen forskjeller som ikke kommer frem her, og det er tiden anvendt på selve komprimeringen. Det er meningsløst å ha "god" komprimering hvis det tar 1 måned å utføre komprimeringen. Generelt er det faktisk slik at de beste komprimeringmetodene tar noe lenger tid, også i denne testen. Og selv om lzma og xz komprimerer like bra, er xz faktisk å foretrekke, da denne bruker vesentlig kortere tid.

Man oppnår mindre komprimering "per byte" hvis det man pakker innholder mange bilder (eller musikk). Dette gjenspeiles blant annet i wordpress-eksempelet over, som generelt har dårligere pakkeratio enn de andre tilfellene.
Sunday 28 November 2010
post alfakrøll kjetilbm.net

(INGEN reklame, takk!)