アンチウィルス業界はここ4〜7年の間に大きく変化してきた。さかのぼること2008年辺りまでは当社も他の企業と同様に、シグニチャファイルやファイルのスキャンを非常に重視していた。そしてそれがスケールしないことが明らかになると、我々はより有用な攻撃パターンの検出へと移行した。さらに、攻撃が成功した結果ドロップされるファイルを検知しようとするよりも、最初の段階で感染を避けることに焦点を合わせ始めた。

 洗練された方法で物事を行うには、優れた可視化が必要だ。そのため、当社はビッグデータの取り扱いを開始しなければならない。重大な事実を述べなければなるまいが、どんな間抜けでも大量のデータを収集することはできるのだ。だから、ビッグデータを小さく理解可能な情報へ変換するところに技がある。しかしながら、データマイニングを行うため我々はユーザからデータを集めねばならず、これがプライバシーの観点から問題になり得る。当社がどのような種類のデータを収集し、どのように処理するのか、人々は尋ねるだろう。

 こうした疑問に答えるため、当社のInternet Security系列の製品が収集する情報について詳細に述べたホワイトペーパーを記した。ホワイトペーパーはここで読むことができる。

data_whitepaper (187k image)

 当社のデータ収集の基本原則は、必要なもののみ収集し、可能な限り早い段階で匿名化することだ。当社がシステムデータを入手できるよう、クライアント側でサニタイズ可能なすべてのデータは、あらかじめクライアント上で取り除いている。ユーザの個人データのように見えるものが当社のデータベースに残ることは一切ない。クライアントのIPアドレスなど、クライアント側でサニタイズ不可能なデータは、データを処理する最初のサーバ上で除かれる。インポート時にサニタイズを行う複数の階層を潜り抜けた、ユーザに関連するデータを削除する目的で、当社は顧客データに対し定期的なクリーンアップを実行する。

 当社は攻撃を食い止めるために必要なものをすべて認知する取り組みを続けていくが、同時にユーザについて何かを知るようにはならないことを確認している。