【ITパスポート試験】作成したデータはファイルとして記録される

アプリケーションソフトで作成したデータ(文書)は、ファイルとして補助記憶装置に記録されます。ファイルは、データをひとつの固まりとして記録するために使う単位です。
ファイルには大きく分けて、独自フォーマットと共通フォーマットという二つがあります。
独自フォーマット
ファイルには、文字や画像といった実データのほかに、多くの場合アプリケーションソフト独自の編集情報(文字の大きさや印刷のために必要な情報など)も記録されています。
このようなファイルは独自フォーマットのファイル形式といって、そのファイルを作成したアプリケーションソフト以外では読み込めません。
共通フォーマット




多種多様な環境でデータのやり取りを行いたい場合は、共通フォーマットというファイル形式でデータを記録します。共通フォーマットとして、広く利用されているファイル形式には下記があります。
- テキスト形式
-
文字コードと、改行やタブなど一部の制御文字のみで作られるファイル形式です。文字を扱うアプリケーションソフトであれば、まず間違いなく読み書きすることができます。
- CSV形式
-
基本的にはテキスト形式なのですが、個々のデータである文字や数字をカンマ(,)で区切り、行と行を改行で区切ることで、表形式のデータを保存することに特化したファイル形式です。
-
画像が埋め込まれた書類を、コンピュータの機種やOSの種類に依らず、元の通りに再現して表示することができる電子文書のファイル形式です。文書配布時における標準的なフォーマットとなっています。
データの種類と代表的なファイル形式




アプリケーション独自の形式でファイルとして補助記憶装置に記録することを、「ファイル形式」や「データ形式」といいます。データの種類と、その代表的なファイル形式を挙げます。
画像用のファイル形式
- BMP(ビットマップ)
-
画像を圧縮せずにそのまま保存するファイル形式です。画質は一切劣化しませんが、ファイルサイズは大きくなります。
- JPEG(ジェーペグ)
-
写真を保存するのに向いている画像圧縮方式です。圧縮率が高く、フルカラーの画像を扱えるため、ディジタルカメラで写真を記録する用途などでも使われています。不可逆圧縮を行うため、圧縮のレベルに応じて画質が劣化します。
- GIF(ジフ)
-
イラストやアイコンなどの保存に適した画像圧縮形式です。可逆圧縮であるため、画質の劣化はありませんが、扱える色数が256色までという制限を持ちます。
- PING(ピング)
-
当初はGIFの代替として登場しましたが、フルカラーを扱える上に可逆圧縮であるため画質の劣化もないという、ある意味万能な圧縮形式です。ただし単純な圧縮率ではJPEGの方が勝ります。
音声用のファイル形式
- MP3(エムピースリー)
-
音声を圧縮して保存するファイル形式です。人に聞こえない範囲の信号を削り落とすことでデータ量を削減するなど、不可逆の圧縮を行います。音楽CDレベルの音質を表現できるとされていることから、インターネット上の音楽配信や携帯音楽プレーヤーなどで用いられています。
- MIDI(ミディ)
-
音声そのものではなく、ディジタル楽器の演奏データを保存することのできるファイル形式です。MIDIデータを使うことで、ディジタルを演奏させることができます。
動画用のファイル形式
- MPEG(エムペグ)
-
動画を圧縮して保存するファイル形式で、不可逆圧縮を行います。ビデオCDに使われるMPEG-1、DVDに使われるMPEG-2、インターネット配信や携帯電話で使われるMPEG-4などがあります。
可逆圧縮と不可逆圧縮




ファイル形式の説明で登場した、可逆圧縮と不可逆圧縮について説明します。画像や音声、動画などのマルチメディアデータは、そのまま保存すると膨大なデータ量になってしまいます。
そのため、なんらかの圧縮技術を用いて、データサイズを小さくして保存する必要があります。
- 画像ファイル
-
画像ファイルの場合、「画像の縦横比を維持したまま、縦横のサイズを小さくする」か、「画質を下げる」などの方法がとられます。例えば、LINEで画像を添付する際には、自動的に圧縮して画質を下げて送ってくれています。
- 動画ファイル
-
画像ファイルと同様に、画質(解像度)を下げることが比較的簡単にファイルを小さくする方法です。また、時間軸に沿って各コマの変化があったところだけをデータを持つようにしたりして、データを圧縮しています。
- 音声ファイル
-
音声ファイルの場合、ビットレートと呼ばれる音楽・音声ファイルの音質を下げることで、ファイルのサイズダウンをすることが可能です。また、人間には聞こえない高い周波数の音を切り落としたりしてデータを圧縮しています。
不可逆圧縮は元データに戻らない




そうして圧縮されたファイルを開くときは、逆方向の伸張(解凍)という展開作業を行って、元のデータを復元します。元々のデータを間引く形で圧縮したものは、伸張後も厳密な意味の「元と同じ」データにはなり得ません。このような圧縮形式を不可逆圧縮と呼びます。
可逆圧縮は元データに完全に復元
可逆圧縮は、元のデータを一切毀損せず、完全に元通りに復元できるように圧縮する手法のことです。ただし、非可逆圧縮に比べると圧縮率は低くなります。
データ圧縮率とは、データを圧縮した際に、圧縮後のデータが元のデータのどのくらいの情報量に減ったかをパーセンテージで表す割合です。
作成したデータはファイルとして記録される まとめ
- データは、ファイルとして補助記憶装置に記録され、独自フォーマットと共通フォーマットがある。
- 共通フォーマットには、テキスト形式、CSV形式、PDFなどのファイル形式がある。
- 画像や動画などは、データが膨大になるため圧縮して保存し、可逆圧縮と不可逆圧縮という方法がある。
【ITパスポート試験】過去問題練習と解説




ファイル形式-1(H21年春期)
問:マルチメディアのファイル形式であるMP3はどれか。
ア:G4ファクシミリ通信データのためのファイル圧縮形式
イ:音声データのためのファイル圧縮形式
ウ:カラー画像データのためのファイル圧縮形式
エ:ディジタル動画データのためのファイル圧縮形式
出典:ITパスポート試験ドットコム
ファイル形式-2(H17年春期)
問:PDF(Portable Document Format)の特徴として、適切なものはどれか。
ア:印刷イメージを正しく表現できる“ページ記述言語”であるが、ファイルを圧縮して保存することができない。
イ:使用ソフトウェアに関係なく文書を流通させることができるが、書式を受け渡すことができない。
ウ:タグを含んだテキストファイルで、タグを用いた検索が効果的に行える。
エ:ワープロソフトなどで作成した文書の体裁を保持でき、異なるプラットフォームでも表示ができる。
出典:基本情報技術者試験ドットコム