2019年12月4日水曜日

「桜を見る会」と「シンクライアント方式」

みなさんこんにちは。

2019年12月に、国会では「桜を見る会」についての政府-野党間の応酬が行われています。個人的は「桜を見る会」よりも優先して議論すべきことがあるのではないかと思いつつ日々のニュースを流していたところですが、政府サイドから「シンクライアント方式」というワードが飛び出して話題になっています。2019年12月2日の午前の官房長官記者会見の模様が記事になっていたので、引用します( その後参議院本会議で安倍首相が同様の答弁を行いニュースとなりました )。
――招待者名簿については、電子データも削除して復元できないとの説明だが、サーバーを破壊するなど物理的に復元できない措置を取っているのか。

「内閣府が採用しているシステムは、サーバーデータを集中管理する『シンクライアント方式』であり、(個々の)端末にデータは保存されていない。運用事業者によれば、サーバーのデータを破棄後、バックアップデータの保存期間を終えた後は、復元は不可能であるという報告を内閣府の事務方から聞いている」

――そうなると、もうサーバー内にも電子データは残されていないのか。

「今、私が申し上げたとおりだ」

――サーバーデータのバックアップ保存期間は、省庁によってもシステムによっても違うと思うが、内閣府の場合はどのくらいか。

「私は承知していない。ただ、運用事業者によれば、サーバーのデータを破壊後、バックアップデータの保存期間を終えた後は、復元は不可能であるという報告を内閣府から受けている。詳細は事務方にお尋ねいただきたい」

この「シンクライアント方式」ですが、国会で首相答弁の内容に IT なワードが出てきたからか、マスコミや Twitter 等で話題になっていますが、マスコミの解説記事や SNS のつぶやきなどは政権を攻撃したいがための誤った解釈や雑な発言にあふれています。すべてを取り上げるわけにはいかないのですが、目に付いたところを見ていきたいと思います。


本題に入るまえに「サーバ」「サーバー」の表記・発音ゆれについて
読み方はどちらが正解?『サーバ』なのか『サーバー』なのか?
 としてそれなりの文量の文章を書いていますが、これは表題とは関係ない揚げ足取りの言説ではないでしょうか。 IT の分野で文章を公にする仕事を手がけたことがあるのであればメディアによって表記ゆれがあるのは常識で、実務上はメディアそれぞれが定めるルールに従うわけですが、政治の場面で発音揺れがあったことをとりあげる価値がどれだけあるのか不明です。魚の「鯖」に聞こえたという話もいまさら揶揄されることではないし、ネットスラングで「サーバー」のことを「鯖」と表記する程度には「よくある話」です。

その後、サーバー上のデータを復旧するてだてとして
一つの方法が、『データサルベージ』で検索してみるとわかりやすい。サルベージとは、沈没船などの引上げ作業のことであり、失ったデータの復元復旧方法なのだ。
として削除したデータが復元できると述べていますが、そのためには物理的にかかわりのある全てのシステムを止める必要があります。内閣庁の業務の大半を数週間にわたり、止めることは現実的な方法になりえるのでしょうか。そして
またエンジニアとしては、絶対にどこかで万一のためのバックアップは必ずとってあるのが一般企業での考え方だ。いくら上層部から削除しろと言われてもだ。国家機密であれば、その限りでないのかもしれないが…。
これは筆者が勝手に思い込んでいる妄想にすぎません。「万一のためのバックアップ」が流出するリスクはどうケアすべきでしょうか。やるべきことをやり、やるべきでないことはやらないのがプロフェッショナルというものです。
こちらは、国会の答弁ではなく公職選挙法(公職選挙法221条では、買収および利害誘導罪について規定)なので立法機関の国会ではなく、司法機関の側でやりとりしてほしいとさえ願っている。
そもそも日本は(建前上であったとしても)三権分立が前提であり、司法から行政・立法への牽制は意見立法審査権を行使することで、「桜を見る会のデータを消したこと」が憲法に反することを明らかにする必要があります。

また、立法から行政への牽制は国政調査権の行使ということになりますが、これは逮捕や物品を押収することはできず、調査と記録提出を求めることにとどまります。技術的な議論以前に内閣府が使っているサーバーを押収してデータサルベージするような制度は現在の日本には存在しません。

つづいての記事はこちら。

ITジャーナリストの井上トシユキ氏だ。こう続ける。 
「シンクライアント方式は完全なデータ消去が困難なシステム。単なる中継サーバーならともかく、集中管理している大本のサーバーが現在も稼働していれば、元データは確実に残っています。削除しても特殊なソフトウエアを使えば復元可能です。完全にデータを消すにはサーバーに物理的な攻撃を加え、木っ端みじんにするしかない。それこそ東京地検特捜部の家宅捜索前に、ハードディスクを電動ドリルで破壊した小渕優子事務所のような荒っぽい手口を用いるしかありません」
某巨大掲示板方面から現在の立場になった井上トシユキ氏ですが、サーバーサイドの見識が乏しく「完全なデータ消去が困難な」「元データは確実に残っています」「特殊なソフトウェアをつかえば復元可能」と、確率的な問題を断定しています。「宝くじは必ず当たる」あるいは「宝くじは必ず外れる」といっているようなものです。

ただ検察の捜査前に物理破壊した例をあげ、実際の手続きに踏みこもうとしたところだけ若干評価できる側面があると感じています(しかし国政調査権では押収できないのですが)。

最後にとりあげるのはこちら。

石川氏は「データ消去とは、本に例えると目次を消しただけに過ぎない。目次を消すとページは見つけにくいが、実際のデータは残っている。専門業者がサーバーを止めて作業すれば復旧できる可能性もある」との見方を示す。 
シンクライアント方式におけるデータ復旧の可否について上原教授は「結論、不可能ではないが決して簡単ではない」と指摘。データ復元のためには担当省庁すべてのサーバーを止める必要があるといい、「復旧作業には莫大なコストと手間がかかる。コストは大きく分けて2つで、(1)日常業務を行っている省庁の仕事を全部止めて復旧作業を行う必要性、(2)膨大なサーバーのデータの中から1つのデータを見つける為に、職人と呼ばれるレベルのエンジニアが何人も数日間張り付いての作業が必要。費用は数百万円以上~数千万円ほどかかる可能性がある」という。
石川氏の説明をうまく上原教授が補足し、良い解説になっていると思います。両氏共に技術的な観点から、サーバー上のデータ復旧の可能性について語っています。しかし、それを受けた
そのコストについて、BuzzFeed Japan記者の神庭亮介氏は「逆に頑張れば復元できるということで、この金額ならお金がかかっても究明してほしいと思う」とした上で、「政府の資料は原則残すべきで、例外的に消すのであれば何を消したのかを別途記録するぐらい厳格にやった方がいいと思う。
という議論が非常に軽薄に思えてなりません。「この金額ならお金がかかっても」というのは誰かのポケットマネーではなく我々が納めている税金であるのはもちろんのこと、「誰が」「どのような法・制度を根拠に」行うのかを考慮しているとは思えません。公文書の保存についても一応ルールは存在しているわけで、それをどう適用していくのかということを議論すべきです。もちろん保存期間や対象を広げれば広げるほどコスト(=税負担)が上がるわけで、そこまでの覚悟をもった発言には私には見えませんでした。

「内閣府の業務を3週間止めてサーバー上のデータを解析せよ。その間に北朝鮮から飛翔体が飛ばされたがその初動に遅れ本土に着弾し甚大な被害が出るかもしれないけど、そのリスクはやむなしとする」などとは到底私には言えません。

個人的に「桜を見る会」については、必要であれば適切に運営してほしいと考えていますが、昨今の議論をみていると政権批判のためにむりやり材料をひねり出しているように思えてなりません。資料を破棄したのが悪いのであれば紙であろうがデータであろうが同じ考え方が適用できるはずですし、そのようにITシステムは機能するのが理想です。

批判のための批判を行うのにどれほどの価値があるのでしょうか。