データ科学で未知の物質に迫る
材料や物質は、あらゆる製品や部品に使用される基本的な要素で、日本のお家芸とされるものづくりには、革新的な新素材の開発が不可欠だ。この材料開発の世界を、データ科学と材料科学を融合させた「マテリアルズ・インフォマティクス(MI)」と呼ばれる手法が劇的に変えようとしている。
「従来の材料開発は、研究者の直感や経験による材料設計、大規模なシミュレーションと実験による物性評価、その後の設計指針の見直しというサイクルの繰り返しで実施されてきましたが、一つの物質の発見から実用化に至るまでに膨大な時間と費用を要していました。これに対し、シミュレーションや実験を、大量のデータから導かれた統計モデルに代替させ、スピーディな物性評価試験を実施して、実用化までの期間を大幅に短縮させようという試みがMIです」
そう話す統計数理研究所の吉田亮准教授は、2017年7月に同研究所が設立した「ものづくりデータ科学研究センター」の長を務め、最先端のデータ科学を結集して材料開発、ひいては日本のものづくりに革新をもたらす手法の創出を目指すデータ科学のスペシャリストだ。
人類が現在までに合成、発見した有機化合物の総数は1億種類を超えるが、合成可能な化合物のバリエーションは〝10の60乗〞以上という膨大な数にのぼると見積もられている。新素材の候補ともいうべきそれらすべての物質を実際に設計し、物性を一つひとつ実験で確かめていくことは不可能である。そこで、データ科学の出番というわけだ。
「従来は費用と時間の制約から、ごく少数の候補材料だけが実験や評価の対象になっていました。今後、データ科学によるシミュレーション、すなわちデータを用いた予測で大量の候補材料を高速にスクリーニングできるようになれば、多くの未知物質が発掘されることが期待されます。ものづくりの様々な領域でこのアプローチを実践し、研究・開発期間の大幅な短縮とコストの低下を実現することが、私たちの狙いです」
材料開発の領域で新たな革新を起こす
MIは、データ科学と材料科学を融合した手法である。吉田氏は「データ科学単独で埋蔵物質を発見できれば御の字だが、現時点でそれは難しい」と話す。「データ科学の解析手法の多くは内挿的予測を行うためのもので、既知のデータと予測対象のデータの類似性に基づいて予測します。例えば、材料の物性評価では、物質の構造が近ければ物性も近いという原理に則って予測を行います」
もっとも、革新的な材料は未踏領域に存在することが多く、その周辺にデータは存在しない。
この限界を突破するには、実験や理論とデータ科学の解析手法の融合が不可欠なのである。
「リアルな実験やシミュレーションを用いて、実験計画法に則った合理的デザインのもとでデータを追加しながら、統計モデルの予測可能領域を段階的に拡大して外挿性を少しずつ高めていくというアプローチを行っています。私たちはこれまで、物質・材料科学の分野でデータ科学による外挿的な予測を可能にする機械学習アルゴリズムを開発し、産学連携で革新的機能材料の発見を目指してきました。次のステップは、ものづくりの様々な領域で設計と製造のデータ科学を実践していくことです」
現在、同センターでは化学・素材メーカーなどとこの取り組みを進めている。段階的に取得したデータをアルゴリズムに追加し、アルゴリズムがシミュレーションで発掘した仮想物質を実際に合成してデータを追加して、外挿性を獲得するプロセスを繰り返しているところだ。
「取り組みを進めることで将来、材料の設計からシミュレーション、実験までのすべてを仮想空間内で賄えるかもしれません。究極的には、データさえ整えば誰でも新材料を発見できる可能性があります。日本のものづくりが諸外国と〝パワーゲーム〞で勝負することが難しくなっていくなか、巨大な装置や社会インフラを必要としないデータ科学が、日本のものづくりを強力に後押しすると信じています」
吉田 亮
准教授 博士(学術)
よしだ・りょう/2004年、総合研究大学院大学後期博士課程修了。05年、東京大学医科学研究所特任助手。07年、統計数理研究所モデリング研究系助教。11年、統計数理研究所モデリング研究系・データ同化研究開発センター准教授。17年7月、ものづくりデータ科学研究センターセンター長。総合研究大学院大学複合科学研究科統計科学専攻准教授など兼職多数。
コメント