Pipeline Pilotはデータを高速に処理できる非常に優れたデータサイエンスプラットフォームです。テキスト、画像、分子構造、データベース等のデータを集約し、機械学習や統計解析を活用することで自社の様々なデータを有効活用するための強力な基盤になります。
Pipeline Pilotは、プログラミング・スキルに関係なく、多様なデータ処理をすばやく実現できます。各種の処理はパーツ(コンポーネント)で提供され、自由に変更もでき、そのパーツを組み合わせて独自の解析も行なえます。たとえば、実験データベースからのデータ収集、機械学習による予測モデル作成、そのモデルを組織内で展開運用するという一連の作業を自動化するための機能を多数備えています。
ニューラルネットや勾配ブースティング(GBDT)などの高性能な学習手法の普及にともない、業務としての運用に耐えるプラットフォームの重要性はますます高まっています。Pipeline Pilotは長年にわたってアップデートを繰り返し、堅牢さと使いやすさを両立しています。たとえば勾配ブースティングによる機械学習モデルを本番サーバへデプロイするということも、コンポーネントのドラッグ&ドロップで簡潔に行うことが可能です。
材料開発の領域でもデータサイエンスの導入が進んでいます。マテリアルズ・インフォマティクスでは、人間の発想を超えた発見を狙うためや、または原料が実験値に及ぼす複雑な挙動を追うために、シミュレーションで生成した数億以上のデータを扱うことも珍しくありません。そのためには単に最新のシミュレーションができることに加えて、データベースやジョブ管理システムとの連携が必須となります。Pipeline Pilotをプラットフォームとして利用することにより、ゼロからこれらのシステムを構築した場合の維持管理コストや多大な社内の研究者の時間を節約できます。
Pipeline Pilotで作成されたアプリケーションはWebブラウザ経由で実行することも、RESTful APIとして外部アプリケーションから呼び出すことも可能です。またPipeline PilotではPythonやRとの連携機能も備えています。たとえば社内のデータサイエンティストが作成したPythonプログラムをプロトコル化し、Webサービスとして公開すれば、組織内でベストプラクティスを素早く展開することが可能です。
お気軽にお問い合わせください
受付時間 9:00-17:30(土・日・祝除く)