クルマはもっと知能化できる――。最先端の機械学習と画像認識技術を駆使したデータサイエンティストの挑戦
自動運転などの最先端領域で、中核を担う技術として期待されている人工知能(AI)。世界トップクラスの自動車部品メーカーであるデンソーもその例に漏れず、かねてからAI研究に力を入れてきた。同社のAIの先行開発拠点・デンソーアイティーラボラトリで、自動車の走行安全を支える機械学習や画像認識技術の研究開発に携わる佐藤育郎氏に、これまでの歩み、自動運転の現状、そして今後のビジョンなどを聞いた。
学ぶならアメリカで。父親のアドバイスで高校卒業後に単身渡米
「何事もとことん突き詰めなければ気がすまないタイプ。だから研究者に向いていたと思う」という佐藤氏。幼い頃から研究者という職業に憧れを抱いていたというが、そのきっかけを与えてくれたのは父親だった。
「父は大学教授で、化学の研究者でした。家庭内では仕事の話をいっさいしませんでしたが、週末に大学のラボによく連れて行ってくれたんです。まだ小さかった私は一人で遊んでいたことを覚えています。初めて見るビーカーなどの実験用器材や、フラスコに満たされた液体を目にしているうちに、自分も将来は研究者になりたいと思うようになりました」そんな佐藤氏は高校を卒業後に渡米、オハイオ大学に入学する。
「『物理を学びたい』と父に伝えたところ、『基礎的な学問をやるのなら、若いうちからアメリカに渡ったほうがいい』と勧めてくれたんです。父もアメリカで客員教授を務めた経験があり、それに基づいたアドバイスだったと思います。その提案にしたがって留学することに決めました」
同大学では物理と数学を専攻し、卒業後はメリーランド大学大学院へ。物理学でドクターを取得した。
「当時の研究テーマは、素粒子物理学。大型加速器による実験を連想するかもしれませんが、コンピュータを駆使した計算科学で素粒子の世界に迫る研究です。数値シミュレーションでプログラムコードを作成する必要があったため、当時からプログラミングをしていました。その経験が今の仕事にも生きています」
ドクター取得後は、カリフォルニアのローレンス・バークレー国立研究所でポスドク。2年間、理論物理の研究に従事した。帰国後、デンソーアイティーラボラトリに就職し、画像認識技術などの開発に携わるようになり、現在に至っている。
「大学で研究を続ける道もありましたが、理論物理の世界は狭き門です。同時並行で、企業の研究職として働くキャリアも模索しました。数理が好きでしたから、必ずしも物理学にこだわる必要はないとも。自分の数理的な知見や才能が生かせる場所を探していくなかで、当社と出合ったんです。多少のプログラミング経験があったとはいえ、情報分野はほぼ未知の世界。面接担当者の話を聞き、ここなら自分の力が生かせるに違いないと確信し、入社を決めました」
小型プロセッサと単眼カメラだけで高度な画像認識を実現
2008年の入社以降、佐藤氏は機械学習と画像認識技術の開発を手がけてきた。車載カメラの画像から歩行者や車両などを認識するためのアルゴリズムの研究だ。もっとも、入社直後の数年間のことを、佐藤氏は「とても肩身の狭い時代でした」と述懐する。「当時は〝機械学習〞が今ほど一般的になっておらず、まだクルマに応用できるような技術ではない、という考え方が主流でした。状況が一変したのは12年です」
その年の冬、機械学習の分野に〝革命〞が起きる。物体認識の手法や精度を競う国際コンテスト「ILSVRC2012」で、トロント大学(カナダ)のチームが画像に映っている物体を特定するAIをディープラーニングで構成、圧倒的な認識率を記録して優勝を果たしたのだ。これがブレイクスルーとなり、世にディープラーニングがいっきに広まることになるが、当時は、その有用性について半信半疑な人も少なくなかった。
「入社直後からニューラルネットを触っていて一定の知識を持っていました。トロント大の成果のすごさと、これからどんなことが起ころうとしているのかすぐにわかりました」
その当時、カメラを利用した歩行者検知そのものはすでにいくつか製品化の事例があり、ステレオカメラを利用すれば、対象物との距離の認識なども可能だった。しかし、認識できることは、歩行者がそこに〝存在すること〞のみ。歩行者の詳細な属性までは認識できなかった。歩行者の属性を自動で認識し、その後の行動まで予測できれば、制御の幅が格段に広がるはずだが、そのためには高精度の画像認識が必要になる。
「事故を起こさないためには自動車が、まず〝どのような歩行者なのか〞を認識することが重要です。ディープラーニングというアプローチを活用すれば、私の研究はいっきに加速すると確信しました」
研究を進めた佐藤氏は、14年に画期的な成果を発表。「Tegra K1」という小型のモバイルプロセッサを利用して、歩行者のリアルタイム認識を行うシステムを構築したのだ。同システムの特徴は、歩行者の身長、歩行者との距離、歩行者の体の向きを、たった1枚の静止画像から算出できること。それも単眼カメラでの構成でだ。これであれば装置の小型化、低価格化がいっきに進み、より多くの自動車に搭載できる。もちろん、交通事故の減少に大きく寄与する成果でもある。
「当時、『ディープラーニングは、演算量が多すぎて車載用の小型のプロセッサでリアルタイムに処理することは不可能』という考えが一般的でした。私は独自のニューラルネットワークの学習方法を構築することで、その常識を覆したのです。おそらく世界初のケースだったと思います。発表後の反響は想像以上で、様々な講演や発表の依頼が舞い込むようになりました。それまでとは打って変わって忙しくなったことを覚えています」
すでに民主化されたニューラルネットの次を見据えた研究を
今、世界中の企業や研究機関がディープラーニングの研究に注力しており、次々に新たな手法が発表されている。その様相を、佐藤氏は「ニューラルネットワークはすでに民主化されたのです」と表現する。
「率直に言って、ニューラルネットは〝先行開発〞の対象ではなくなりました。我々のような先端研究に携わる人間は、その〝次〞を目指す役割を担っていると考えています」
佐藤氏が話す〝次〞なる一手としては、スーパーコンピュータの世界的権威である、東京工業大学の松岡聡教授と共同で実施した、「TSUBAME」(東工大が保有するスパコンの名前)による研究がある。
「ディープラーニングはデータ量が多ければ多いほど精度が高まるのは事実で、今のところ、その限界を示す研究は発表されていません。自動車の走行安全ひいては自動運転の実現には、当然ですがかなりシビアな精度が要求され、アルゴリズムの開発・改良努力だけでその精度を達成することは難しい。本質的には、データ量の増加で対応する必要があります。しかしデータ量の増大は、必然的に学習時間の増大を招きます。いずれ、データは大量にあるものの計算パワーが不足し、いつまで経っても学習が終わらない時代がやって来るに違いない、という危機感を持つようになりました。そこで、これからはスパコンでディープラーニングすべきという考えのもと、松岡教授との共同研究をスタートさせたのです。これは当時としてはかなり先駆的な取り組みだったと自負しています」
コンピュータはこれまで「ムーアの法則」に従って性能を向上させてきたが、昨今、その法則が限界に近づいていることが指摘されている。しかし佐藤氏は、「その法則は、データ量の増大という形に置き換わって残っていくはず」と話す。
「私たちは、これからの〝データの時代〞に、備えておく必要があります。松岡先生との共同研究はその一環で、私は超並列マシンのような分散環境に応じた機械学習のアルゴリズム開発を担当しました。その成果はデンソー本体にもフィードバックしています。このように、今後も〝次〞の課題やトレンドを見据えた研究を手がけていきたいと願っています」
最後に佐藤氏は、後進の研究者に向けて次のようなエールを送ってくれた。「私が専門にしていた物理では、常に〝本質〞を徹底的に深く考え抜く姿勢が要求されました。物理をやっていると自然とそのスキルが身につくのですが、この〝深く考える〞という行為は、どの研究分野でも必要とされるはず。シュレーディンガー方程式でも何でも構わないので、成果の有無にかかわらず、一つのことを徹底的に考え抜く時間をどこかのタイミングで設けてください。それをするかしないかで、皆さんの未来は大きく変わってきます」
さとう・いくろう
設立/2000年8月
代表者/代表取締役社長 岸本正志
従業員数/26名
所在地/東京都渋谷区渋谷2-15-1 渋谷クロスタワー28階
コメント