archive / アーカイブ

アーカイブとは、コンピュータにおいて、複数のファイルを一つのファイルにまとめたファイル、もしくはそれを作成する過程を指す。

この意味でのアーカイブを行なうソフトウェアを総称してファイル・アーカイバ (file archiver)、または単にアーカイバと呼び、アーカイバで作成したファイルはアーカイブファイルと呼ぶ。また、アーカイブを書庫、アーカイブすることを「書庫化する」という場合もある。逆に元のファイルを取り出すことは抽出または展開という。

アーカイブファイルには、元のファイルを正しく復元するために、少なくとも元のファイル名やファイルサイズなどの情報が含まれなければならない。多くのアーカイバは、ファイルシステムがもつ、タイムスタンプや所有者・アクセス権などといった、ファイルに関するメタデータをも格納する。

アーカイブはデータ圧縮(特に可逆圧縮)の前工程として行われることが多いが、これは単一のファイルを個別に符号化するよりも、関連したファイルを一つのファイルと見なして符号化を行うことで、データ圧縮の効率を高めることができるためである。これをソリッド圧縮という。

しかしながら、圧縮したファイルを展開する際に、関連ファイルの全体を展開する必要が生じるため、ZIPのようにファイルを圧縮した後にアーカイブするフォーマットや、データ圧縮時に決まったサイズのブロックに分けて符号化することで、目的のファイル周辺のみを解凍して取得することができるフォーマットが多い。アーカイブファイルが圧縮効率と展開に際しての利便性はトレードオフの関係にあるため、データ圧縮規格が乱立する要因ともなっている。

データ圧縮規格の成熟にともなってデータ圧縮機能とアーカイブ機能を統合して同時に処理できるソフトウェアが増えてきたため、そういった統合型のソフトウェアのことをアーカイバと呼ぶことが多くなったが、本来の意味では圧縮機能を持っているとは限らない。

PAGE TOP