データマスキングとは?その概要と活用例
情報漏洩ゼロへの新常識
2024年4月17日
著者: Ahona Rudra
翻訳: 逆井 晶子
この記事はPowerDMARCのブログ記事 What is Data Masking, and When Can You Use It? の翻訳です。
Spelldataは、PowerDMARCの日本代理店です。
この記事は、PowerDMARCの許可を得て、翻訳しています。
データマスキングは、様々な手法を用いて、機密データをユーザから隠蔽するプロセスでありながら、アプリケーションプログラムやビジネスプロセスで使用できるように維持するものです。
毎年、データ侵害により数百万人の個人情報が漏洩し、多くの企業が数百万ドルの損失を被っています。
実際、2021年におけるデータ漏洩の平均コストは424万ドルに達しました。
個人識別用情報(PII)は、侵害されたすべてのデータカテゴリの中で最も高価なものとなっています。
その結果、多くの企業がデータ保護を最優先事項としています。
そのため、データマスキングは多くの企業にとって、機密データを保護するための不可欠な手法となっています。
データマスキングとは?
データマスキングは、機密データをマスキングすることです。
機密データを非機密データや擬似データに置き換えることで、機密データを保護します。
これは、機密データに対する不正アクセスや意図しない改竄を防ぐためのセキュリティ対策として使用することができます。
データマスキングは、ソフトウェア開発ライフサイクル(SDLC)のさまざまな段階で実行することができます。
- アプリケーション開発中
-
iOSアプリケーションでもAndroidアプリケーションでも、実際のデータではなくマスクされたデータを使用してアプリケーションを開発します。
これにより、元のデータが開発者やテスターに公開されことを防ぎます。 - テスト中
-
テストケースを実行する際、実際のデータではなくマスクされたデータを使用します。
これにより、テスターがテスト中に元のデータにアクセスすることを防ぎます。 - 展開後
-
アプリケーションは実際のデータではなくマスクされたデータを使用して展開されます。
これにより、展開後にエンドユーザが元のデータにアクセスすることを防ぎます。
データマスキングの種類
機密データを効果的にマスキングすることで、権限のないユーザやアプリケーションにさらされる可能性のある環境で処理または保存されている間、機密情報を保護します。
データマスキングは、開発、テスト、本番環境など、アプリケーションライフサイクルの複数のステージで適用することができます。
データマスキングは以下のいずれかの方法で実装することができます。
- オンザフライデータマスキング
-
アプリケーションが機密データを処理している際に実行されます。
アプリケーションは、機密フィールドをランダムな数字、文字、記号に置き換えた後、他のアプリケーションやバックエンドシステムに送信します。 - 動的データマスキング
-
暗号化やトークン化などの技術を使用して機密データを保護します。
必要な保護レベルに応じて適切な手法を適用します。 - 静的データマスキング
- Advanced Encryption Standard(AES)アルゴリズムを使用してすべての機密データを暗号化し、擬似的な値に置き換えてからネットワーク内で送信します。
- 決定論的データマスキング
-
この方法では、実際の値をランダムな値に置き換えて、マスキング後に2つの行の値が一致しないようにします。
その結果、元の値の意味は完全に失われますが、マスクされていないかのように、マスクされたデータセットの統計分析を行うことができます。 - 統計的データ難読化
-
統計的データ難読化は、データのパターンを乱すランダム化技術を使用して機密性を保ちつつ、構造などの意味を維持します。
ただし、一部のケースでは機密性や整合性を損なうリスクがあります。
データマスキング技術
データマスキングを実現するために使用できる技術には、以下のようなものがあります。
- シャッフリング
-
列データ内の要素を並べ替え、相関関係がなくなるようにします。
例:1から9の値がある場合、シャッフリングにより行の順序がランダムに変更されます。 - ぼかし処理
-
ガウシアンぼかしや中央値フィルターなどのノイズ関数を適用して、行内のフィールドを隠します。
この手法は列や行の総数を変えませんが、値は変更されます。
ただし、線形回帰分析などの統計分析技術でノイズ関数を逆解析されやすく、相関攻撃に対する保護効果は限定的です。 - 代替
-
機密データをシーケンス番号など、元データに関する情報を含まないプレースホルダー値に置き換えます。
例:金融サービスでは、クレジットカード番号を元のカード所有者を特定できない無意味な番号に置き換えます。 - トークン化
-
トークン化は、機密データを、それ自体に価値がなく、特定のカテゴリに属するとアプリケーションで認識される別のデータに置き換える方法です。
例:銀行口座番号を実際の番号ではなくランダムなトークンに置き換える。 - 文字のスクランブル処理
- 機密データを暗号化し、元の形式に復元できないようにする技術です。
データマスキングの使用例
データマスキングは、以下のようにデータセキュリティの脅威から保護します。
- データ漏洩の防止
-
データマスキングにより、クレジットカード番号、社会保障番号、その他の個人識別情報 (PII) などの機密情報がデータベースやスプレッドシートに保存されている場合でも保護されます。
ハッカーや不正アクセス者がデータベースやスプレッドシートにアクセスしても、実際のデータは閲覧することができず、無意味なデータに見せることができます。 - 安全な情報共有
-
データマスキングにより機密情報を保護することで、第三者と安全に情報を共有することができます。
これにより、お客様リストや売上データなどの重要情報をプライバシーと機密性を維持しながら共有することが可能となり、効率的に協力作業をすることができます。 - データ構造の維持
-
データのフォーマットや構造を保持しながらテストデータとして使用することがデータマスキングにより可能となります。
これにより、新しいシステムを導入する際に、既存アプリケーションの変更やコードの書き換えを避けることができ、運用への影響を最小限に抑えることができます。 - 偶発的なアクセスの防止
-
データマスキングは、機密データへのアクセスを許可されたユーザだけに限定します。
これにより、名前、住所、電話番号、社会保障番号(SSN)などの個人識別情報の漏洩や、医療記録、クレジットカード番号、運転免許証番号、パスポート番号などの識別情報の偶発的な公開を防ぐことができます。
最後に
データマスキングは、機密データを守る重要な技術です。
保護プロセスがなければ、データ漏洩のリスクが高まります。
導入は慎重に計画しましょう。
さらに、メールのセキュリティを強化するには、DMARCを導入してスプーフィングやフィッシング攻撃から保護しましょう。