既存の経験的・理論的枠組みにとらわれない新たな研究アプローチとして、マテリアルズ・インフォマティクスをはじめとする様々なデータ駆動型研究開発手法が提案されています。実際に個々の手法を研究業務として導入するためには、高精度な機械学習手法を利用できること、蓄積されたデータを即座に分析可能な形に出力できることが求められます。それを実現するためには、人・技術・データを繋ぐための研究開発プラットフォームが重要な基盤となります。
マテリアルズ・インフォマティクスを始めとするデータ駆動型研究開発には、実験データやシミュレーションデータをもとに、材料物性の予測や最適パラメータ推定を行う機械学習手法が用いられます。当社では単なる学習モデルの提供にとどまらない、解析ノウハウの共有や実行を含む、データ駆動型研究開発の基盤づくりをご提案しています。
数値計算のエキスパートはもとより、実験の専門家や未経験者であっても、データの流れを設計・管理するデジタルラボアーキテクトとしてデータ駆動型R&Dを実践することができます。ソフトウェア導入時にはヒアリングに基づき、適切なソフトウェアとサポート、トレーニングや必要に応じた技術支援を提供します。材料シミュレーションや機械学習のプロフェッショナルには、作成した解析コードの社内展開のための共有プラットフォームづくりを支援します。
実験情報を収集し電子化するにあたっては、大きく始めることも小さく始めることも可能です。各研究者の実験ノートを完全に電子化することはメリットも大きい反面、移行に伴う労力も大きくなります。一方で、実験指示書や報告書はエクセルでやりとりされていることも多く、通常業務を極力変えない形でのデータ蓄積を始めやすい部分です。
たとえば電子実験ノートのシステムを構築すると、実験者は実験記録を入力した従来のエクセル上で数クリックすると社内サーバでそのデータをレポート化することができます。サーバ上で登録されたレポートは、すぐに研究メンバーが閲覧可能になります。研究企画や知財管理のメンバーも閲覧者に含めることができます。
電子実験ノートのシステムでは機密性の高い実験記録を扱うため、社内で完結するオンプレミス構成も選択可能です。また改ざん防止、知的財産の保護のために、電子署名を付与することもできます。
電子的に集積された実験記録と個人管理のエクセルや紙の実験記録との違いは、膨大なデータから情報の抽出・整理することが可能かどうかです。個人管理のデータを集めるには、それを所有しているそれぞれの研究者の時間を割く必要があり、場合によってはファイル紛失や担当者異動によりデータがなかなか揃わないこともあります。適切に実験記録が電子化されていれば、現在から過去に至るまでの多数の実験に対しても、実験種別に表形式に出力し、即座にデータサイエンスを活用した解析ができます。
実験データそのものと同じく、データサイエンティストが作る機械学習モデルや解析ノウハウもまた、蓄積・継承するべき価値を持ちます。しかしPythonやRのスクリプトをそのまま共有しようとすると、OSや実行環境の違いに起因するエラーのトラブルサポートに追われることが多くあります。データサイエンティストの本来の業務を妨げずに、解析ノウハウを組織の技術として昇華するためには、専門家でなくても自発的に実行できる共有プラットフォームを準備して解析コードを一元集約することが必要です。
また、機密性が高い研究内容を扱うためには、このようなプラットフォームは社内サーバで完結するオンプレミス構成であることが求められます。
実際の材料開発では実験パラメータが数十個あることも珍しくなく、より良い実験パラメータを見出すためには、勘・経験・蓄積データのフル活用が求められます。表やグラフを活用したインタラクティブな解析に始まり、さらに精度良く最適化するための様々なツールやアプローチが開発されています。
材料開発では、高性能な予測モデルが作れたとしても、さらにその先に、要求物性を実現するために最適な実験パラメータを見出すことが必要とされます。それには、例えば単なる表形式のデータであっても様々な難しさがあります。たとえば単純に実験パラメータを網羅的に調べることはほとんどの場合実行不可能です。(仮に実験パラメータが離散値で10水準20パラメータだったとすると1020=100億×100億という巨大なパターンが発生します。) また、パラメータにも種類があり、数字などの連続パラメータと、ON/OFFのような不連続なパラメータが混在していることがあります。そのため、適切な探索手法の選択が重要です。特に簡単操作かつ効率的な実験パラメータの大域的最適化ツールが必要となります。
お気軽にお問い合わせください
受付時間 9:00-17:30(土・日・祝除く)