データ用語集

Written By: Ontrack

Date Published: 2023/11/08 9:11:37

データ用語集

IPアドレス

インターネットに接続されたコンピューターネットワークに参加しているデバイスに割り当てられた数値ID。アドレスは、ピリオドで区切られた4つの数字の文字列で構成されています。

(Information Systems:情報システムまたはInformation Technology:情報技術)通常、コンピューターを担当し、コンピューターシステムを実行する企業内のチームまたは人を指します。

ISP

(Internet Service Provider:インターネットサービスプロバイダー)インターネットへのアクセスを提供するビジネス。

アクティブレコード

アクティブレコードとは、現在進行中の活動や処理中の活動に関連する記録で、日々の業務上の要求に応えるために定期的に参照されるものです。 アクティブレコードは、ネイティブアプリケーション形式で存在し、通常のビジネスルールを超えた変更の制限なしに、ビジネスプロセスのためにアクセスできます。

アクティブデータ

アクティブデータは、コンピューターシステムの直接アクセスストレージメディアに存在する情報であり、それが作成されたオペレーティングシステムおよび/またはアプリケーションソフトウェアを介して容易に表示することができます。また、ユーザーは削除、変更、再構築することなくこのデータにすぐにアクセスできます(例:ワードプロセッシングファイルやスプレッドシートファイル、コンピューターのオペレーティングシステムで使用されるプログラムやファイル)。

圧縮

ファイルのサイズを小さくする技術のことです。圧縮プログラムは、時間と帯域幅の両方を節約できるため、ネットワークユーザーにとって価値があります。

アプリケーション

アプリケーションは、ファイルやデータベースの情報を入力、保存、表示、変更、抽出できるようにする、1つまたは複数の関連するソフトウェアプログラムのコレクションです。通常、この用語は「プログラム」または「ソフトウェア」の代わりに使用されます。アプリケーションには、ワードプロセッサ、インターネット閲覧ツール、スプレッドシートなどがあります。

アーカイブデータ

アーカイブデータとは、コンピューターシステムのユーザーが直接アクセスすることはできないが、組織が長期保存や記録保持の目的で維持している情報のことです。アーカイブデータは、CD、光磁気媒体、テープ、その他の電子ストレージ媒体などのリムーバブルメディアに書き込まれたり、システムのハードディスクに圧縮された形式で保持されたりすることがあります(つまり、通常は災害復旧を目的としてバックアップテープやディスクに保存されているデータです)。

アーカイブ/電子アーカイブ

アーカイブは、レコードを保存するための長期リポジトリです。電子アーカイブは、コンテンツを保存し、変更を防止または追跡して電子記録へのアクセスを制御します。

ASCII

(American Standard Codeの頭字語)ASCIIは、キーボードの各キーに数字を割り当てるコードです。ASCIIテキストは特別なフォーマット機能を含んでいないため、ほとんどのコンピューターシステムで交換したり読み込んだりすることができます。

暗号化

メッセージやファイルの内容を、読むことを許可されていない人には理解できないようにするための手順/技術のことです。

イーサネット

PCをネットワーク化してLANを構築する一般的な方法を指します。

1キロバイト = 1,024バイト(通常は1,000バイトと呼ばれます)
1メガバイト = 1,024キロバイト(通常は1,000キロバイトと呼ばれます)
1ギガバイト = 1,024メガバイト(通常は1,000メガバイトと呼ばれます)
1テラバイト = 1,024ギガバイト(通常は1,000ギガバイトと呼ばれます)
1ペタバイト = 1,024テラバイト(通常は1,000テラバイトと呼ばれます)

ERP(Enterprise Resource Planning)

組織のデータとプロセスを1つのシステムに統合する方法のことです。通常、ERPシステムには、統合を実現するために、ハードウェアやソフトウェアを含む多くのコンポーネントが含まれます。ほとんどのERPシステムは、組織内の様々な機能のデータを保存するために、統一されたデータベースを使用します。

移行されたデータ

移行されたデータとは、あるデータベースやフォーマットから別のフォーマットに移行された情報のことで、通常、あるハードウェアやソフトウェア技術から別の技術への変更に伴って移行されます。

インスタントメッセージング(「IM」)

インスタントメッセージングとは、同時にオンラインになっている2人以上のユーザー間で即時にやり取りを行う電子コミュニケーションの形式です。

インターネット

小規模な共有パブリックネットワークを接続することで形成された相互接続のグローバルパブリックネットワークを指します。最もよく知られているパブリックネットワークはインターネットです。これは、TCP/IPプロトコルを使用して情報交換を容易にするネットワークの世界的なネットワークです。

イントラネット

公共のインターネットから切り離された、より小さなプライベートネットワークを相互に接続したネットワークのことです。

Webサイト

1つの管理主体が管理するURI(URL(Uniform Resource Locators)を含む)のコレクションのことです。さまざまなタイプのURI(例:ファイル転送プロトコルサイト、telnetサイト、World Wide Webサイト)が含まれる場合があります。

HRIS

(Human Resources Information System:人材情報システム)企業内の人事、給与、管理、会計部門のデータ入力、データ追跡、データ情報のニーズに対応するソフトウェアまたはオンラインソリューション。 通常はデータベースとしてパッケージ化されており、何百もの企業が何らかの形でHRISを販売しています。機能はHRISごとに異なります。

HTML

(Hypertext Markup Language:ハイパーテキストマークアップ言語)Web上のページを作成するためのタグベースのASCII言語。

エクストラネット

セキュリティファイアウォールを経由して企業のイントラネットサイトにアクセスする、インターネットベースのアクセス方法を指します。 このタイプのアクセスは通常、2つ以上の企業が継続的に電子ドキュメントを共有する共通の場所を必要とする場合に利用されます。

FRCP

(Federal Rules of Civil Procedure:連邦民事訴訟規則)連邦裁判所システムにおける訴訟手続きを定めた法律。

FTP

(File Transfer Protocol:ファイル転送プロトコル)インターネット上でコンピューター間のファイル転送を可能にするインターネットプロトコルです。

MIS

(Management Information Systems:経営情報システム)MISは、経営の機能を遂行するために必要な情報の形でデータを収集、処理、保存、配布する、計画されたシステムです。

OCR

(Optical Character Recognition:光学式文字認識)紙のドキュメントからデータを取得し、それを編集可能なテキストデータに変換する技術。 ドキュメントを最初にスキャンしてから、OCRソフトウェアによって文字、数字、その他の文字を検索します。

オフライン

(ネットワークに)接続されていないか、電源がオフになっていることを指します。

オフラインデータ

日常的に使用しているネットワーク外の電子データ(バックアップテープなど)を、ネットワークではなくオフラインのストレージシステムを通じてのみアクセスできるように保存すること。

オペレーティングシステム(OS)

コンピューターを機能させるために、ソフトウェアのその他の部分が依存するソフトウェア。 ほとんどのPCでは、WindowsやMacintosh OSが使われています。また、科学技術分野ではUnixやLinuxもよく使われるOSです。

親子関係

eディスカバリにおいて、1つのメールやストレージフォルダーに起因する一連のドキュメントを表す用語です。これらのタイプの関係は、主に当事者がメールの開示請求に直面したときに発生します。「子」(添付ファイルなど)は、そのすぐ上の「親」(メールやZipファイルなど)に関連付けられているか、埋め込まれています。

オンライン

(ネットワークに)接続されていることです。

オンラインストレージ

ネットワークまたは他の場所で日常的に使用される、フルアクセス可能な情報として電子データを保存すること。

 

 

画像

ある時点でのストレージ媒体の内容を正確にコピーしたもの。

キーワード検索

ユーザーが指定した1つまたは複数の単語を含むドキュメントを検索すること。

ギガバイト(GB)

ギガバイトとは、コンピューターのデータ記憶容量を示す指標で、およそ10億(1,000,000,000)バイト(実際には1,073,741,824バイト)に相当します。

GIF

(Graphic Interchange Format)画像のコンピューター圧縮形式。

キャッシュ

頻繁に使用する情報を一時的に保存し、すばやくアクセスできるようにしたコンピューターのメモリーの一種です。

キロバイト(KB)

1キロバイトは、コンピューターのデータ記憶容量の指標であり、およそ1,000バイト(実際には1,024バイト)に相当します。

鏡像

コンピューターフォレンジック調査および一部の電子情報開示調査で使用される鏡像は、コンピューターハードディスクのビットごとのコピーであり、フォレンジック調査中にオペレーティングシステムが変更されないようにします。「ディスクミラーリング」または「フォレンジックコピー」と呼ばれることもあります。

兄弟

兄弟とは、当該ドキュメントと共通の親を持つドキュメントのことです(例:同じ親メールを共有する2つの添付ファイル、または同じZipファイル内の兄弟ドキュメント)。

記録

メディアやフォーマットに関係なく、組織にとって価値のある情報。総称して、この用語はドキュメントや電子的に保存された情報の両方を説明するために使用されます。

記録管理

記録管理とは、作成を含む情報のライフサイクルに関わる計画、管理、指示、組織化、訓練、促進などの管理活動です。

記録管理者

記録管理者とは、記録の保存期間中、記録の物理的な保管と保護に責任を持つ個人のことです。電子記録のコンテキストでは、管理はすべての組織の記録管理機能の直接の一部ではない場合があります。

記録のライフサイクル

記録が作成されてから破棄されるまでの期間。

記録保持

「訴訟ホールド」を参照してください。

記録保持期間、保持期間

特定の記録シリーズを保管しなければならない期間で、期間(例:4年)、イベントまたはアクション(例:監査)、またはその組み合わせ(例:監査後6か月)で表されます。

記録保持スケジュール

記録の種類と保存期間を記載した記録管理の計画であり、記録を廃棄したり、履歴アーカイブに移管したりするための継続的な権限を与えることが目的です。

GUI

(Graphical User Interface:グラフィカルユーザーインターフェース)オペレーティングシステムを使いやすくするために、アイコンなどのグラフィック要素を利用する一連の画面表示とメタファー。

Cookie

Webサーバーによってユーザーのハードディスクに書き込まれる小さなデータファイル。これらのファイルは、ユーザーを識別する特定の情報(パスワードや訪問したページのリストなど)を含んでいます。

クリーンルーム

エンジニアが壊れたメディアを「修理」する、ほこりや静電気のない環境のことです。オントラックのクリーンルームは、ISO 146441-1 Level 5/Class 100規格に準拠しています。

形式

ファイルの内部構造のことで、ファイルの保存や使用方法を定義します。 特定のアプリケーションでは、データに独自の形式が定義されている場合があります(例:「MS Wordドキュメントファイル形式」)。多くのファイルは、元のアプリケーションまたは互換性のある形式で動作するように設計されたアプリケーションのみを使用して表示または印刷できます。一般的に、コンピューターストレージシステムでは、ファイルの形式(および作成に使用した可能性のあるアプリケーション)を示す命名規則によってファイルを識別します。(例:Microsoft Wordドキュメントファイルの場合は「DOC」、Microsoft Excelスプレッドシートファイルの場合は「XLS」、テキストファイルの場合は「TXT」、「HTML」(Webページなどのハイパーテキストマークアップ言語(HTML)ファイルの場合)。ユーザーは別の命名規則を選択することもできますが、その場合、アプリケーションでのファイルの扱いに影響が出ることがあります。

コーディング

ドキュメントコーディングとは、紙のドキュメントからケース関連情報(著者、作成日、送信日、受信者、開封日など)をキャプチャーするプロセスのことです。

コンピューターフォレンジック

コンピューターフォレンジックとは、コンピューターの使用状況の再現、残存データの調査、技術的分析によるデータの認証、またはデータやコンピューターの使用状況の技術的特徴の説明に関する問題がある場合に、電子データの復旧、認証、分析のための特殊な技術を使用することです。 コンピューターフォレンジックには、エンドユーザーやシステムサポート担当者が利用できる通常のデータ収集および保存技術を超えた、専門的な知識が必要です。

 

 

サーバー

ネットワーク上の任意のコンピューターで、ネットワークのユーザーがクライアントPCで共有するデータやアプリケーションを含みます。

削除

削除とは、コンピューター上のアクティブなファイルやその他のデータ記憶構造からデータが削除され、削除されたデータを復元するために設計された特別なデータ復元ツールを使用しない限り、アクセスできなくなるプロセスです。

削除されたデータ

削除されたデータとは、過去にライブデータとしてコンピューター上に存在していたデータで、コンピューターシステムやエンドユーザーの操作によって削除されたものです。削除されたデータは、継続的な使用によって上書きされるか、削除されたデータを削除するために特別に設計されたソフトウェアプログラムで「ワイプ」されるまで、全体または一部が記憶媒体に残ります。データ自体が消去された後も、削除されたデータに関連するディレクトリエントリ、ポインター、その他のメタデータがコンピューターに残っている場合があります。

削除されたファイル

再利用可能と指定されたディスクスペースを持つファイルのことです。削除されたファイルは、新しいファイルで上書きされるまでそのまま残ります。

作成者/発信者

ドキュメントの作成者とは、そのドキュメントの作成または発行に責任を負う人物、事務所、または指定された役職を指します。場合によっては、ドキュメントを作成するソフトウェアアプリケーションが作成者のIDを取得し、それをドキュメントに関連付けることがあります。

サンドボックス

他のネットワークに接続されていないネットワークまたは一連のネットワークのことです。

サンプリング

サンプリングとは、通常、データセットに関連する情報が含まれているかどうかを統計的にテストするプロセスを指します。これは、特定の訴訟においてデータのどのリポジトリを保存および検討すべきかの判断や、検索やその他のデータ抽出手順の有効性や効果の判断など、訴訟に関する多くの問題に対処するための有用な手法です。サンプリングは、当事者に特定の電子記録の確認を求めることによる相対的なコスト負担と利益に関する情報を裁判所に提供するのに役立ちます。

残留データ

残留データ(「アンビエントデータ」ともいう)とは、コンピューターシステム上でアクティブでないデータを指します。残留データとは、(1)メディアの空き領域に存在するデータ、(2)ファイルの空き領域に存在するデータ、(3)機能的に削除されたファイル内のデータで、削除解除や特殊なデータ復元技術を使用せずに、ファイルを作成したアプリケーションでは見ることができないものを指します。

JPEG

(Joint Photographic Experts Group)写真用の画像圧縮規格です。これらの画像ファイルの標準ファイル拡張子は.jpgまたは.jpegです。

ZIP

PCダウンロードアーカイブで広く使用されている圧縮と解凍のオープンスタンダードです。これらのアーカイブは、サイズが圧縮されているだけでなく、複数のドキュメントを1つのファイルにアーカイブすることができます。 ZIPは、WinZipやDrag and ZipなどのWindowsベースのプログラムで使用されています。ZIPファイルの拡張子は.zipです。

システム管理者

(Sysadmin、Sysop)ネットワークが適正に機能するように維持する担当者のことです。

CD-ROM

コンパクトディスクを使用して約1,500枚のフロッピーディスクに相当するデータを保存できるデータ記憶媒体です。

重複除去

重複除去(「De-duping」)は、電子記録をその特性に基づいて比較し、データセットから重複する記録を取り除くプロセスです。このプロセスは、2つの方法のいずれかで実行できます。まず、ユニバーサルまたはケース(レベル)重複除去では、ケース全体で各ドキュメントの1つのコピーのみが保持されます。次に、管理者重複除去では、1人の管理者が各ドキュメントの1つのコピーを保持します。管理者(レベル)重複除去では、ケース全体で重複が発生しますが、どの管理者が特定のドキュメントのコピーを保有していたかも可視化されます。 重複除去は、ドキュメントのハッシュ値を比較して正確なコピーを特定することや、実質的ではない小さな違いだけで重複を特定する技術によって行われることがあります。

スキャン

スキャンとは、ハードコピーのペーパードキュメントを、コンピューターシステムで使用するためのデジタル画像に変換するプロセスです。ドキュメントがスキャンされた後、フィールド検索や全文検索、ドキュメントの即時検索、および全範囲の電子ドキュメントレビューオプションを使用してレビューできます。

スタンドアロンコンピューター

モデム経由を除いて、他のコンピューターやネットワークに接続されていないパーソナルコンピューターのことです。

スラックスペース

残存データの一種であるスラックスペースは、論理記録情報の終端から物理ディスクレコード終端までのディスク上のファイルスペース量です。スラックスペースには、記録からソフト的に削除された情報や、現在の記録と同じ物理的な場所に保存されている過去の記録の情報、メタデータの断片など、コンピューターシステムのフォレンジック分析に有用な情報が含まれていることがあります。

ソフトウェア

コンピューターに有用な働きをさせるためのコード化された命令(プログラム)です。

スポリエーション

スポリエーションとは、進行中または予想される訴訟、政府の調査または監査に関連する可能性のある記録を破棄することです。制裁が正当化される前に必要とされる意図のレベルについては、裁判所によって解釈が異なります。

属性

属性とは、場所、長さ、タイプなど、他のデータから区別しているデータの特性です。属性という用語は、「データ要素」または「プロパティ」と同義語として使用されることがあります。

訴訟ホールド

訴訟ホールドとは、現在または予想される訴訟、監査、政府の調査、またはその他の問題の結果として、記録の通常の処分または処理を一時停止する通知です。企業やIT組織への具体的な通達は、「保留」、「保存命令」、「停止命令」、「凍結通知」、「保留命令」、「保留通知」と呼ばれることもあります。

 

 

DAT

(デジタルオーディオテープ)一部のバックアップシステムで記憶媒体として使用されます。

データ

コンピューターシステムに保存され、アプリケーションがタスクを実行するために使用する情報のことです。

データ編集

変換や抽出をしないと読むことができない形式の情報のことです。データコンピレーションは、Fed. R. Civ. P.34(a)ではESIとして明示されており、ルール34諮問委員会ノートでも議論されています。

帯域幅

所定の期間にネットワーク接続を介して送信可能な情報やデータの量です。通常、帯域幅はビット/秒(bps)、キロビット/秒(kbps)、またはメガビット/秒(mps)で表されます。

断片化されたデータ

断片化されたデータは、1つのハードディスクやディスクのさまざまな場所に分割して保存されているライブデータのことです。

ディスク

フロッピーディスクやハードディスクを指します。 どちらのタイプも、データがデジタルで保存された磁気記憶媒体を持っています。ディスクはCD-ROMを指す場合もあります。

TIFF

(Tagged Image File Format)ビットマップ画像を保存するための最も広くサポートされているファイル形式の1つで、多くのレビューツールでデフォルトの表示形式として一般的に使用されています。多くの場合、TIFF形式のファイルは拡張子が.tifです。

TCP/IP

(Transmission Control Protocol/Internet Protocol)インターネットの機能の基本的な動作を定義するプロトコルのコレクションのことです。

デスクトップ

通常、個々のPC(ユーザーのデスクトップコンピューター)を指します。

デジタル

情報を、「1」と「0」という数字の文字列として保存することです。

テラバイト(TB)

テラバイトとは、コンピューターのデータ記憶容量を示す指標であり、およそ1,000億(1,000,000,000,000)バイト(実際には1,099,511,627,776バイト)です。

電子記録

コンピューターなどのマシンによる処理を必要とする形式で記録された情報で、その他の点で記録の定義を満たすものを指します。

添付ファイル

添付ファイルは、保存または転送の目的で別のレコードに関連付けられたレコードまたはファイルです。1つの「親」または「マスター」レコードに複数の添付ファイルが関連付けられている場合があります。添付ファイルおよび関連レコードは、1つのユニットとして管理、処理されることがあります。一般的に、この用語は、単一のメッセージ単位として転送および保存されるメールに関連付けられた1つまたは複数のファイルを指します。特定の状況では、添付ファイルのコンテキスト(例:親メールとそれに関連するメタデータ)が重要になる可能性があるため、組織は、ポリシーで添付ファイルの親レコードからの関連付け解除を許可するか制限するかを検討する必要があります。

電子記録のリポジトリ

電子記録のリポジトリとは、電子記録と関連するメタデータが保存されている直接アクセス可能なデバイスのことです。「記録ストア」、「オンラインリポジトリ」、「記録アーカイブ」と呼ばれることもあります。

ドキュメント

Fed. R. Civ. P. 34(a)では、ドキュメントを「文章、図面、グラフ、チャート、写真、フォノレコード、その他のデータ編集を含む」と定義しています。電子情報開示の世界では、ドキュメントとは、電子ファイルを表すページのコレクションのことでもあります。 メール、添付ファイル、データベース、Wordドキュメント、スプレッドシート、グラフィックファイルはすべて電子ドキュメントの例です。

ドキュメント保持

組織の通常の業務において作成、送受信されるハードコピーおよび電子ドキュメント、データベース、メールなどのドキュメントおよびデータの維持のことです。

ドキュメント保持ポリシー

組織の通常の業務において作成、送受信されるハードコピーおよび電子ドキュメント、データベース、メールなどのドキュメントおよびデータを検証、維持、破棄するための体系的な計画のことです。

電子情報開示

メール、Webページ、ワードプロセッシングファイル、コンピューターデータベース、およびコンピューターに保存されている事実上すべてのものを含む電子ドキュメントおよびデータの情報開示のことです。技術的には、コンピューターを使ってのみ読むことができる媒体に存在するドキュメントやデータは「電子的」です。このような媒体には、キャッシュメモリ、磁気ディスク(コンピューターのハードディスクやフロッピーディスクなど)、光学ディスク(DVD、CDなど)および磁気テープが含まれます。

 

 

ネイティブ形式

変換または処理の前に、ソースのコンピューターまたはサーバーから収集されたソースドキュメント。電子ドキュメントには、元の作成アプリケーションによって定義された関連ファイル構造があります。このファイル構造は、ドキュメントの「ネイティブ形式」と呼ばれます。ドキュメントをネイティブ形式で表示または検索するには、元のアプリケーションが必要になる場合があるため(たとえば、Microsoft Wordのドキュメントを表示するには、Microsoft Wordアプリケーションが必要になる場合があります)、電子ドキュメント処理の一環として、ドキュメントを標準的なファイル形式(tiffやPDFなど)に変換することがよくあります。

ネスト

ドキュメントやファイルがドキュメントの中に挿入されている場合を指します(例:メールの中に添付ファイルが入れ子になっている場合や、Microsoft Wordドキュメントの中にグラフィックファイルが入れ子になっている場合)。

ネットワーク

データの交換やリソースの共有のために接続されたコンピューターやデバイスのグループ。

ノード

ネットワークに接続されているデバイス。PC、サーバー、プリンターはすべてネットワーク上のノードです。

 

 

バイト

1バイトは8ビットで構成されます。バイトは、コンピューターが文字(つまり、「a」、「1」、または「&」)を表すために使用するビットのコレクションです。「メガバイト」は約100万バイト(実際は1,048,576バイト)、「ギガバイト」は約10億バイト(実際は1,073,741,824バイト)です。

バイナリー

二進数、つまり一連の0と1で構成される数字です。0と1は、電子デバイスの2つの電圧レベルで簡単に表すことができるため、2進法はデジタルコンピューティングで広く使用されています。

バックアップ

元のデータの紛失や破損に備えて、データのコピーを作成することです。ほとんどのユーザーはファイルの一部をバックアップし、多くのコンピューターネットワークでは、自動バックアップソフトウェアを使用して、ネットワーク上の一部またはすべてのデータのコピーを定期的に作成しています。バックアップシステムの中には、記憶媒体としてデジタルオーディオテープ(DAT)を使用しているものもあります。

バックアップデータ

バックアップデータとは、組織で現在使用されていない情報のことで、スペースを解放し、災害時のデータ復旧を可能にするために、ポータブルメディアに定期的に切り離して保存されます。

バックアップテープ

バックアップテープはスペースを解放するために組織で現在使用されていないデータを保存するためのポータブルメディアですが、ディザスターリカバリーにも使用可能です。

バックアップテープのリサイクル

バックアップテープのリサイクルとは、組織のバックアップテープを新しいバックアップデータで上書きするプロセスのことで、通常は一定のスケジュールで行われます(曜日ごとに夜間バックアップテープを使用し、特定の日の日常バックアップテープを翌週の同じ日に上書きする、週次および月次のバックアップを一定期間オフサイトに保管してからローテーションに戻すなど)。

ハッシュ

コピーが正確なレプリカであるかどうかを検証するために使用できるドキュメントの一意の数値。 ハッシュ値は、長い文字列に数式を適用することによって得られます。文字が変更されると、結果として得られるハッシュ値が変化し、ドキュメントが変更されたことを示します。

ハードディスク

PCのプライマリストレージユニット。デジタルデータを磁気的に書き込んだり消去したりできる1つまたは複数の磁気メディアプラッターで構成されます。

パブリックネットワーク

パブリックインターネットの一部であるネットワーク。

非アクティブな記録

非アクティブな記録とは、閉じられた、完了した、または終了したアクティビティに関連する記録です。非アクティブな記録は、もはや日常的に参照されることはありませんが、報告要件を満たすためや、監査または分析の目的で保持する必要があります。非アクティブな記録は、一般的に長期保存形式で保管され、業務処理の目的でのみアクセス可能で、変更が制限されています。ビジネス状況によっては、非アクティブな記録が再びアクティブになることがあります。

PC

「パーソナルコンピューター」の略語で、一般にデスクトップワークステーションを指しますが、ラップトップも含まれる場合があります。

PDA

(Personal Digital Assistant:携帯情報端末)ハンドヘルドデジタルオーガナイザー。

PDF

(Portable Document Format:ポータブルドキュメントフォーマット)Adobe Acrobat Readerを使用してドキュメントを表示および印刷できるようにフォーマットするためのAdobeの技術です。tiffと並んで、多くのレビューツールでよく使われる表示形式の1つです。

ビット

データの最小単位の測定値です。ビットは、バイナリーコードの「1」または「0」コンポーネントのいずれかです。ビットのコレクションをまとめてバイトが形成されます。

ペタバイト(PB)

ペタバイトとは、コンピューターのデータ記憶容量の指標であり、およそ千兆(1,000,000,000,000,000)バイト(実際には1,125,899,906,842,624バイト)に相当します。

PST

(個人用フォルダーファイル)Outlookのデータを保存する場所です(OutlookをMicrosoft® Exchange Serverなしで使用する場合)。PSTファイルは、メールアカウントを設定する際に作成されます。Outlookのフォルダー、メッセージ、フォーム、ファイルのバックアップやアーカイブのために、追加のPSTファイルを作成することができます。PSTファイルのファイル拡張子は.pstです。

ファイル

指定された名前でディスクに保存されている情報のデータのコレクションです。

ファイル拡張子

データファイルのフォーマットやファイル作成に使用されたアプリケーションを識別する、ピリオドを先頭にした3~4文字のタグです。ファイル拡張子は、データを探すプロセスを効率化します。たとえば、コンピューターに保存されている証拠となる写真を探す場合、.gifファイルや.jpgファイルから始めることができます。

ファイル共有

サーバーに保存されているファイルを複数のユーザー間で共有する機能です。ファイル共有はネットワークの重要な利点です。

ファイアウォール

プライベートネットワークのリソースを他のネットワークのユーザーから保護する一連の関連プログラムのことです。

ファイルサーバー

LAN内でネットワーク化された多くのコンピューターがアクセスできる、ファイルの保管場所として使用されるコンピューターです。ファイルサーバーは、メール、財務データ、ワードプロセッシング情報などを保存したり、ネットワークをバックアップしたりするために採用されることがあります。

ファミリ関係

いくつかの共通した特徴のために、関連性のある2つ以上のドキュメントを指します。

ファミリ範囲

最上位の親ドキュメントの最初のページに割り当てられた最初のベイツプロダクション番号から、最後の子ドキュメントの最後のページに割り当てられた最後のベイツプロダクション番号までのドキュメントの範囲の記述です。

VPN

(Virtual Private Network)ノード間の接続に公衆回線を使用し、コンピューター間のデータ転送を安全に行うために暗号化を使用するコンピューターのネットワークのことです。

復元

問題、障害、災害などからのリカバリーを目的として、バックアップ媒体(テープなど)からオンラインシステムにデータを転送することを指します。アーカイブメディアの復元とは、処理(データの照会、分析、抽出、処分など)を目的とした、アーカイブストアからオンラインシステムにデータを転送することを指します。システムのアーカイブ復元には、データの復元だけでなく、元のハードウェアやソフトウェアの動作環境を再現することが必要になる場合があります。システムの復元は、「リカバリー」と呼ばれることがよくあります。

物理的障害

ハードディスクの内部コンポーネントや電子機器の障害。原因としては、衝撃や落下、水害、停電などが挙げられます。このタイプの故障には、主に次の3つのサブカテゴリーがあります。

  • 物理メディアの損傷:データが保存されているプラッターの物理的損傷。これは、プラッターの傷やへこみである可能性があります。この障害は、停止中または動作中に読み取りヘッドがプラッターの表面に接触することで発生します。
  • 電子的障害:電源の異常や電気回路の過負荷による電力サージが発生し、回路基板に取り付けられた電子機器が焼失することで発生します。
  • 機械的障害:ハードディスクの内部部品の障害です。機械的障害には多くの原因がありますが、最も一般的なのはハードディスクの過熱であり、プラッターが膨張するため、読み取り/書き込みヘッドの位置が間違っている可能性があります。

プライベートネットワーク

インターネットに接続されているが、インターネットからは切り離されているコンピューターネットワーク。

プレーンテキスト

最もフォーマットされていないため、コンピューターで作成されたドキュメントの中では最も移植性の高い形式のテキストです。

フロッピー

薄い磁気フィルムのディスクを保護スリーブに収めた記憶媒体ですが、使用頻度はますます少なくなっています。

ブログ

ブログとは、時系列で頻繁に記事が投稿され、ページの上部に表示されるWebサイトのことです。

分散データ

分散データとは、家庭用コンピューター、ノートパソコン、フロッピーディスク、CD-ROM、PDA(Personal Digital Assistant)、Blackberryなどの無線通信デバイス、ZIPドライブ、インターネットサービスプロバイダーやポータルがホストするメールなどのインターネットリポジトリ、Webページなど、ポータブルメディアや非ローカルデバイスに存在する組織の情報です。また、分散データには、アプリケーションサービスプロバイダーやビジネスパートナーなどの第三者が保有するデータも含まれます。

ベイツプロダクション番号

ベイツプロダクション番号とは、プロダクションセット内の各ドキュメントの各ページに割り当てられた追跡番号のことです。

ペーパーディスカバリ

何らかの装置を使わずに読むことができる、紙に書かれた文章を発見することです。

ポインター

ポインターとは、ディスク(またはその他の記憶媒体)のディレクトリ内のインデックスエントリのことであり、電子ドキュメントや電子データが存在するディスク上の領域を特定し、その領域が他のデータで上書きされるのを防ぎます。ほとんどの場合、電子ドキュメントを「削除」すると、ポインターが削除され、ドキュメントを上書きできますが、ドキュメントは実際には消去されません。

保全通知、保全命令

「訴訟ホールド」を参照してください。

 

 

メガバイト(MB)

メガバイトとは、コンピューターのデータ記憶容量を示す指標で、およそ100万(1,000,000)バイト(実際には1,048,576バイト)の大きさです。

メタデータ

メタデータとは、特定のデータセットに関する情報であり、たとえば、いつ、誰が、どのように受信し、作成し、アクセスし、変更したか、また、どのようにフォーマットされているかを記述することができます。ファイルの日付やサイズなど、ユーザーが簡単に見ることができるメタデータもあれば、技術的に熟練していないコンピューターユーザーが利用できないように隠したり、埋め込んだりできるメタデータもあります。メタデータは、一般的にドキュメントを印刷する際には完全な形では再現されません。(通常、情報量の少ない「データに関するデータ」という略語で呼ばれ、データの内容、品質、状態、履歴、その他の特性などを記述します)。 ファイルシステムのメタデータ、ドキュメントのメタデータ、メールのメタデータがあります。さらに、eディスカバリベンダーは、ドキュメントを処理した結果、ベンダーが付加したメタデータを作成および管理することがよくあります。

メールメッセージ

一般に「メール」と呼ばれ、メールシステムを介して作成または受信されるもので、簡単なメモ、正式または実質的な叙述ドキュメント、およびメッセージとともに送信されるワードプロセッシングや電子ドキュメントなどの添付ファイルを含みます。

メールメッセージストア

最上位のメールメッセージストアは、メールシステムがデータを保存する場所です。たとえば、Outlook PST(パーソナルストレージフォルダー)は、ユーザーのMicrosoft Outlookメールアカウントが設定されたときに作成される最上位のファイルの一種です。そのユーザー用に追加のOutlook PSTファイルを作成し、Outlookのフォルダー、メッセージ、フォーム、ファイルのバックアップやアーカイブを行うことができます。ファイリングキャビネットが、その中に入っている紙のドキュメントの一部とは見なされないのと同様に、最上位のストアは一般的にファミリの一部とは見なされません。

モデム

コンピューターと他のコンピューターを電話回線で接続するためのハードウェア。

 

 

焼く

音楽やソフトウェアなどのデータをCD-ROMにコピーする(焼く)ことを意味するスラング。

 

 

LAN

(Local Area Network:ローカルエリアネットワーク)通常、1つのビルやその他の独立した場所にあるコンピューターのネットワークを指します。

RAM

(Random Access Memory:ランダムアクセスメモリ)アプリケーションプログラムを読み込んで実行できる、コンピューターの作業メモリ。

ルーター

ローカルエリアネットワーク(LAN)からのデータを、接続されている他のすべてのコンピューター、プリンター、電話機などのデバイス間でルーティングするハードウェア。

レガシーデータ

古いまたは廃止されたソフトウェアやハードウェアによって作成された重要な電子情報。

レガシーシステム

古いまたは廃止されたソフトウェアおよび/またはハードウェア。レガシーシステムは、将来その情報が必要になったときのために、廃止されたにもかかわらず保持されることがよくあります。

論理的障害

ハードディスクの物理的な状態は正常ですが、ドライブ自体の論理ストレージシステムに何か問題が発生している状況です。論理的な障害は多くの理由で発生する可能性があります。最も一般的なもののいくつかを以下に示します。

  • ウイルス(ウイルスを参照)
  • ドライブまたはディスクパーティションがフォーマットされた:ドライブをフォーマットしたり、新しいディスクパーティションを作成することで、ハードディスクを工場出荷時の状態に戻し、新しいファイルシステムを作成して、新しいオペレーティングシステムをインストールできるようにします。
  • ファイルの削除:ファイルを削除しても消去されるわけではなく、特定のファイルが保存されているドライブの領域は新しいデータで上書きできるようになっています。
 

 

World Wide Web

Webとは、HTML対応のソフトウェア(Netscape、Explorerなど)を使ってデータをやり取りする、インターネット上のすべてのコンピューターで構成されています。Webでのデータ交換は、使いやすいグラフィカルなインターフェース、ハイパーテキストリンク、画像、動画、音声などが特徴です。今日、Webはインターネットの代名詞となっていますが、技術的には実際には1つのコンポーネントに過ぎません。

購読

KLDiscovery Ontrack株式会社 〒100-0011 東京都千代田区内幸町2-2-3 日比谷国際ビル3F (全国拠点一覧)