MITとハーバード大の研究者による、ユーザーが意図した目的でデータを共有できるプラットフォームの構想が発表された。
欧州のGDPR施行もあり、「データはユーザーのもの」という思想は米国でも強まっている。
日本では、情報銀行がこれに近い思想といえるだろうか?
本記事では、MITとハーバード大研究者により公表されたデータプラットフォーム構想「Riverbed」について紹介していこう。
データプラットフォーム「Riverbed」とは?
今回発表された論文は、以下のようなタイトルとなっている。
Riverbed: Enforcing User-defined Privacy Constraints in Distributed Web Services
直訳すると、「Riverbed:分散型ウェブサービスでユーザーが指定したプライバシー制約を強化する」といった意味になる。
全体的な思想としては、ユーザーが事前に指定した条件(論文中では、"Policy"とよぶ)によって、ユーザーが意図した利用のみを実行しようといったものだ。
条件としては、たとえば、「永続的なストレージにはデータを保存しない」や「x.comという外部サービス内のみで共有される」といったものを想定している。
Riverbed の仕組みは?
では、そのようなユーザー許諾型データプラットフォームをどのような仕組みで実現しているのだろうか?
論文から拝借すると、以下のような図と表現することができる。
ユーザー接点となるブラウザーやアプリは、Riverbed プロキシーを介してクラウドサーバーとやりとりをしている。
その Riverbed プロキシーによって、意図しない利用がされないようにコントロールすることになる。
具体的には、ユーザーの許諾条件毎に、「Universe」と呼ばれるアプリケーションのコピーを作成する仕組みとなっている。上図でいう「Universe 0」と「Universe 1」がそれだ。
AliceとBobは同じ許諾条件のため、「Universe 0」に割り当てられ、Charlie は彼らとは異なる条件のため、「Universe 1」に割り当てられている。
こうして、それぞれの Universe で許諾条件通りのデータ利用がなされているかを監督する仕組みを作っているわけだ。
Riverbed の今後
Riverbed を実際のアプリケーションに導入したところ、パフォーマンスの低下は10%未満であったという。
Universe を複製しアプリケーションを実行するということで、システムとしての複雑性は増しそうなものだが、1つの解としてありなのかもしれない。
また、Riverbedには「taint tracking」というトラッキングの仕組みもあるようなので、こちらについて気になる方はぜひ論文を読んでみてほしい。
Riverbed: Enforcing User-defined Privacy Constraints in Distributed Web Services