Menu Contact Forum DonEnglish Deutsch 

Comparatif des performances de
différentes méthodes de compression de fichiers

Méthodologie

   Les résultats présentés ont été obtenus le même jour sur les mêmes dossiers d'un même ordinateur et sont donc parfaitement comparables. Pour la circonstance, j'ai créé treize dossiers comportant chacun quelque cinq mégaoctets de fichiers d'un type courant. Chaque fois que c'était possible, j'ai paramétré la compression de façon la plus puissante (archive solide, taux de compression maximal, etc.).
    En toute logique, la durée nécessaire pour créer l'archive est d'autant plus longue que la compression est puissante. Toutefois, le facteur temps n'a pas été pris en compte, d'autant que la durée de décompression dépend peu de la méthode — en tout cas, pas de façon rédhibitoire — et que les méthodes de compression les plus évoluées peuvent se paramétrer : ainsi, la méthode 7z propose trois algorithmes — LHMA, PPMD et Bzip2 — et six niveaux de compression — « aucune compression », « le plus rapide », « rapide », « normale », « maximum » et « ultra » —, ce qui permet d'adapter la méthode selon la rapidité et la puissance souhaitées. En outre, l'asymétrie de la méthode rend la décompression beaucoup plus rapide que la compression, ce qui constitue un avantage lorsque les postes clients n'ont pas la puissance d'un serveur.

Résultats

   Pour attribuer une note globale, j'ai utilisé une méthode non paramétrique basée sur les rangs — de 1, pour la meilleure méthode, à 20, pour la plus mauvaise — obtenus par chaque type d'archivage pour chacun des treize dossiers, de sorte que la méthode la mieux notée est celle qui est le plus souvent la mieux classée. Ce procédé est plus fidèle que celui utilisant la moyenne et l'écart-type, tout simplement parce que les données que vous avez à archiver ne sont pas réparties de la même façon que celles que j'ai utilisées pour ce test, ni qualitativement, ni quantitativement.

Types*.avi*.dll*.doc*.exe*.gif*.htm*.jpg*.mp3*.mpg*.pdf*.txt*.wav*.zipNote /20TOTAL
Nombre de fichiers16 26138242467944298368119 674
Taille brute5 261 152 5 254 2205 254 6565 254 0565 246 2095 261 1875 246 1165 250 4325 257 7205 257 8765 253 4365 256 0245 262 68068 315 764
7z4 524 067 (2)1 543 179 (3)147 690 (3)3 910 541 (3)4 620 354 (1)341 996 (4)4 770 061 (4)5 053 813 (2)4 879 067 (5)4 258 863 (3)1 270 884 (3)3 670 225 (5)5 226 742 (14)1644 217 482
arj4 696 659 (9)2 160 530 (15)1 018 050 (17)4 130 505 (11)4 702 449 (12)898 370 (17)4 803 740 (11)5 108 093 (17)4 910 699 (16)4 606 736 (15)1 875 329 (16)4 450 535 (12)5 223 905 (13)6,148 585 600
bh4 703 291 (12)2 156 986 (12)1 010 284 (15)4 128 594 (9)4 693 021 (9)889 650 (15)4 806 914 (13)5 105 811 (13)4 904 209 (11)4 601 545 (13)1 848 972 (13)4 451 648 (15)5 201 639 (4)7,548 502 564
bz24 720 926 (18)2 095 832 (7)573 721 (5)4 273 885 (18)4 896 084 (18)645 243 (5)4 743 918 (2)5 069 593 (4)4 888 293 (7)4 444 829 (5)1 531 448 (6)3 771 508 (7)5 238 677 (16)11,746 893 957
bza4 639 340 (6)2 166 940 (17)987 806 (11)4 231 254 (17)4 878 327 (17)783 188 (8)4 787 973 (7)5 076 189 (5)4 873 810 (2)4 618 970 (17)1 516 326 (5)3 770 938 (6)5 227 572 (15)9,847 558 633
cab4 701 113 (11)2 148 386 (10)893 796 (7)4 127 044 (8)4 678 810 (5)842 129 (10)4 798 500 (8)5 099 787 (8)4 900 314 (10)4 584 969 (8)1 846 233 (12)4 451 857 (18)5 201 717 (5)10,848 274 655
gza4 703 371 (13)2 157 116 (13)1 001 990 (13)4 126 436 (7)4 693 136 (10)874 444 (12)4 803 739 (10)5 105 765 (12)4 904 249 (12)4 597 720 (11)1 840 188 (11)4 451 638 (14)5 201 436 (3)9,248 461 228
j4 678 506 (8)1 914 777 (5)703 722 (6)4 057 445 (5)4 681 437 (6)691 916 (6)4 805 059 (12)5 092 070 (7)4 898 847 (8)4 326 394 (4)1 629 228 (8)3 594 954 (4)5 215 150 (12)1346 289 505
jar4 704 088 (14)2 158 273 (14)1 017 205 (16)4 129 816 (10)4 705 456 (13)893 622 (16)4 809 136 (16)5 107 254 (15)4 904 615 (13)4 603 367 (14)1 849 394 (14)4 451 718 (16)5 202 611 (8)6,248 536 555
lha4 711 090 (16)2 215 476 (18)1 020 194 (18)4 204 071 (15)4 830 501 (15)913 845 (18)4 918 792 (19)5 206 933 (19)5 066 716 (19)4 802 049 (19)1 895 771 (17)4 447 253 (10)5 263 136 (18)6,749 495 827
lzh4 711 090 (16)2 215 476 (18)1 066 340 (19)4 143 461 (14)4 819 157 (14)971 166 (19)4 816 349 (18)5 107 584 (16)4 924 974 (18)4 635 416 (18)1 945 961 (19)4 449 756 (11)5 212 837 (11)5,349 019 567
pkz4 899 083 (20)2 354 373 (20)1 173 097 (20)4 401 289 (20)5 120 590 (19)1 018 250 (20)5 162 114 (20)5 253 006 (20)5 203 747 (20)5 076 577 (20)2 084 290 (20)5 027 854 (20)5 264 213 (19)0,252 038 483
rar4 634 009 (5)1 693 150 (4)173 313 (4)3 948 241 (4)4 639 881 (4)318 269 (3)4 780 095 (6)5 081 085 (6)4 887 973 (6)4 258 775 (2)1 318 381 (4)2 657 731 (3)5 202 579 (7)15,543 593 482
rk4 589 894 (3)1 474 339 (2)132 629 (1)3 866 814 (1)4 628 017 (3)257 588 (1)4 434 701 (1)5 017 545 (1)4 787 286 (1)4 498 992 (6)1 168 720 (1)1 659 771 (1)5 183 337 (1)18,241 699 633
rs4 625 725 (4)2 137 145 (9)937 954 (10)4 221 864 (16)4 850 493 (16)768 711 (7)4 776 635 (5)5 066 886 (3)4 878 852 (3)4 612 537 (16)1 560 879 (7)3 804 335 (8)5 240 116 (17)10,747 482 132
sqx4 662 560 (7)2 078 866 (6)991 992 (12)4 105 933 (6)4 699 518 (11)878 469 (14)4 808 697 (15)5 102 452 (10)4 908 341 (14)4 590 245 (10)1 836 245 (9)4 415 575 (9)5 208 275 (10)9,848 287 168
tgz4 707 481 (15)2 165 409 (16)907 006 (8)4 133 949 (12)4 684 949 (7)861 638 (11)4 807 701 (14)5 105 913 (14)4 909 789 (15)4 588 822 (9)1 853 650 (15)4 451 792 (17)5 202 392 (6)7,848 380 491
uha4 498 275 (1)1 474 005 (1)136 880 (2)3 879 360 (2)4 625 014 (2)284 363 (2)4 760 572 (3)5 104 837 (11)4 879 047 (4)4 237 400 (1)1 233 812 (2)2 435 124 (2)5 187 408 (2)17,344 736 097
yz14 814 935 (19)2 128 899 (8)924 706 (9)4 279 162 (19)4 686 669 (8)804 198 (9)4 810 966 (17)5 124 596 (18)4 922 886 (17)4 568 274 (7)1 901 300 (18)4 561 179 (19)5 207 874 (9)6,448 735 644
zip4 701 064 (10)2 155 923 (11)1 009 814 (14)4 135 619 (13)5 270 565 (20)877 679 (13)4 799 508 (9)5 101 205 (9)4 898 961 (9)4 599 883 (12)1 839 080 (10)4 450 719 (13)5 264 564 (20)7,549 104 584
Taille compressée médiane4 701 0892 152 155962 880 4 130 1604 696 327 851 8844 803 7405 103 6454 902 2624 593 9831 839 6344 448 5055 210 556 48 519 559
Taux de compression médian10,6 %59,0 %81,7 %21,4 %10,5 %83,8 %8,4 %2,8 %6,8 %12,6 %65,0 %15,4 %1,0 %29,0 %

Efficacité

   Les fichiers binaires — tels les programmes (com, dll, exe...), les flux audios ou vidéos compressés (avi, mpeg...) ou les archives déjà compressées (cab, odt, rar, sxw, zip...) — se compressent plus ou moins mal ; les fichiers de type texte (css, htm, js, ini, log, txt...) ou ceux qui sont pleins de vide (doc...) se compressent généralement très bien. Sur l'ensemble des données, le taux de compression médian est de 29 %.
   On distingue deux populations de formats de compression. Quatre formats sont nettement plus performants, avec un taux de compression supérieur d'environ 20 % à celui des autres : rk, uha, 7z et rar.

  • Les plus puissantes méthodes de compression :
       La compression rk offre des performances exceptionnelles (18,2/20) et constitue la référence sans rivale de ce comparatif (en fait, il existe une méthode, confidentielle et en ligne de commande seulement, plus puissante encore, mais sa lenteur la rend pratiquement inutilisable). Suivent uha, 7z et rar (17,3, 16,0 et 15,5/20). Le résultat de 7z est dégradé par sa mauvaise performance (14e) pour compresser les fichiers zip, bien que ceci mérite d'être relativisé : la taille de l'archive 7z pèse 5 226 742, soit seulement 0,8 % de plus que la taille de l'archive créée par la méthode la plus performante (5 183 337)...

  • Les bonnes méthodes de compression :
       Vient ensuite la compression jar (.j), dont la note (13/20) permet de souligner que la rusticité n'est pas incompatible avec la performance. Suivent les compressions bzip 2, cabinet, raw (bz2, cab, rs), aux performances honorables (environ 11/20). Notez toutefois que la compression raw ne permet pas d'archiver récursivement des dossiers (ce que ferait un tar.rs, à l'instar d'un tar.gz)..

  • Les autres méthodes de compression :
       Parmi les méthodes peu performantes, zip se classe 14e (7,5/20), avec seulement 5,6 % d'amélioration par rapport à la compression zip de 1990 (pkz) ! Il est piquant de constater qu'elle est la moins efficace pour compresser des fichiers zip : les informations de l'archivage s'ajoutant aux fichiers, qui sont simplement stockés, l'archive a une taille supérieure à la taille des fichiers à compresser !

Portabilité

   Certains types d'archive peuvent être lus par de nombreux logiciels ; d'autres restent confidentiels :

Nombre de logiciels fonctionnant sous Windows pouvant être associés au format (sur neuf)
0j (1)
1akp, aks, bhx, c2d, cdi, fea, fzs, gca hog, hqx, imp, ize, lib, mbf, mdf, ntx, pae, pb5, pdi, qwk, rep, rk, rs, sqx, uha, uzb, uze, wad, yz1
2001, a, bin, bz, bza, cpio, deb, ear, gza, ha, img, nrg, tz, wal, wsz, xpi
3rpm, tbz, tbz2, war
4b64, bh, enc, mim, taz, uu, zoo
5arc, lha, iso, pak, pk3
67z, xxe
7ace, bz2, jar, tgz, uue
8arj, cab, lzh, rar, z
9gz, tar, zip
(1) ce format est lisible par Jar (Jar32), logiciel ne fonctionnant qu'en ligne de commande (mais utilisable sous Windows).

   Les types lisibles par tous les logiciels sont gz, tar, zip. Si vous souhaitez diffuser facilement vos archives ou pouvoir les utiliser partout — par exemple, sur une clef USB —, il est donc plus judicieux de les compresser en zip qu'en j... À l'inverse, vous pouvez préférer un type peu répandu afin d'assurer une plus grande discrétion de vos données. Dans ce cas, les formats j puis rk, rs, sqx, uha, yz1 sont préférables. Notez que la méthode 7z, encore confidentielle en 2005, est déjà adoptée par les deux-tiers des logiciels, en raison de ses grandes qualités et de la politique de diffusion libre choisie par son auteur, Igor Pavlov.

Conclusion

   Si vous devez compresser des données très variées, utilisez les algorithmes globalement les plus performants : rk, uha, 7z, voire rar.
   Si vous avez à compresser une grande masse de données d'un même type, optez pour le format de compression le plus performant pour ledit type : par exemple 7z pour archiver des images gif.
   Le choix de la méthode la plus adaptée peut ensuite se décider, par exemple, selon la portabilité des archives ainsi créées, la simplicité du logiciel utilisé ou son coût. Pour ce faire, je vous propose de consulter mon étude suivante :

Comparaison de différents logiciels de compression (Windows)

Airelle

[ Retour ]