多種類のデータを暗号のまま解析する
現在の第3次AIブームの起爆剤となったのは、ビッグデータを活用した機械学習や深層学習と呼ばれる技術だ。これらの技術の発展に伴い、AIによる意思決定が社会に実装されつつあるが、その根幹となるビッグデータには膨大な〝個人情報〞が含まれると想定される。
AIが人間の重要な意思決定を担うためには、学習・意思決定プロセスにおいて、個人情報などの漏洩や、そのパフォーマンスが悪意を持つ人間や組織に恣意的に操作されないことが求められる。筑波大学の佐久間淳教授は、AIが社会で適切に利用されるために不可欠なセキュリティとプライバシーの基盤技術を研究しており、「完全準同型暗号」と呼ばれる秘密計算の分野で最先端を走っている。2017年には、遺伝子データをはじめとする多様な種類のデータを暗号のまま、従来よりも速いスピードで解析できる秘密計算手法を構築した。
「データを暗号化した状態で他人に委託し、そのデータの中身を秘匿したまま計算や解析を実施して結果だけを返してもらう。完全準同型暗号はそれを可能にする技術で、これを使えば複数の場所に分散している個人情報を用いて、本人のプライバシーを損なうことなく、統計解析や機械学習などが実現できます」この技術の応用例として、遺伝子情報や症例データなどの統計解析を通じた、医療・医学などの分野におけるデータの活用が考えられるという。
「ヒトの遺伝子情報は、個人の将来疾病リスクや能力などと関係する可能性があり、それが外部に漏れると当該人物に悪影響を及ぼすおそれがある。秘密計算技術を使えば、個人の医療情報を保持する医療機関や、個人の遺伝子情報を保持する研究機関は、それらの情報を秘匿したまま統合的に解析できます。遺伝子の解析機関に医療データの中身を知られることなく、医療機関には統計処理した結果のみが示されるため、患者のプライバシーはほぼ確実に守られます。患者の同意のもと、複数の医療機関が連携すれば、各機関は患者の個人情報を外部に開示せずとも、遺伝子変異と疾患の統計的関係など医学の発展に役立つ知見や、ある患者が特定の病気にかかりやすいか否か、その患者の体質傾向の解析結果など、個別の患者の医療に役立つ情報が得られるというわけです」
解析対象となるデータが増えるほど、難病や希少疾患の原因遺伝子が特定しやすくなることはもちろん、いわゆる「個別化医療」の進展も期待される。例えばアメリカでは、年間約10万人が薬剤の副作用で死亡しているといわれている。患者の遺伝子や体質の傾向がわかれば、それに応じた最適な薬剤と用量を処方することで副作用を、また、予防的な外科手術や生活習慣の見直しによって発病が抑えられる可能性も想定できるのだ。
ハッキングAIの危険性も研究対象
秘密計算は、プライバシーを〝防御〞するための技術だが、佐久間教授は〝攻撃〞するための技術の研究も手がける。目的は、既存システムの脆弱性を明らかにすることだ。例えば、AIの分野では顔認証技術が急速に進歩し、コンピュータのユーザ認証などに利用されており、将来的には様々な場面で本人確認での利用が見込まれる。今年2月、佐久間教授は第三者が別のAIを悪用すると顔データを再現できる可能性があるという実験結果をまとめ、〝なりすまし〞などセキュリティの在り方に警鐘を鳴らした。
「現状ではAIのプログラムを攻撃側が読み込むことは困難で、今すぐ悪用されることはないものの、将来的には顔認証が突破されるリスクも想定されます」そう話す佐久間教授の研究室では現在、13名の院生らが研究や実験に勤しんでいる。「当研究室の強みは、AIを〝機械学習〞と〝セキュリティ〞の両面から研究していること。そのためか、学生らは企業の研究所などから引く手あまたの状態です。教え子の就職に頭を悩ませたことはありませんね」と、佐久間教授は目を細める。
佐久間 淳
教授 博士(工学)
さくま・じゅん/2003年、東京工業大学大学院総合理工学研究科知能システム科学専攻博士後期課程修了後、日本アイ・ビー・エム東京基礎研究所に入所。04年、東京工業大学助手、07年、同助教。09年、筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻准教授、17年、同教授。理化学研究所革新知能総合研究センター人工知能セキュリティ・プライバシーチーム・チームリーダー。
コメント