オープンソースモデルインフラストラクチャ
オープンソースモデルインフラストラクチャとは
「オープンソース」とは、コード、アイデア、イノベーションの共有方針であり、業界全体のナレッジベースを専有のままの場合よりも迅速に拡大できるようにします。オープンソースモデルインフラストラクチャでは、ビジネスまたは技術の一部あるいは全部がオープンソースの原則に基づいて構築されています。ほとんどのオープンソースが主にソフトウェアと関連していると考えられていますが、ハードウェア、ロボット工学、製造、サービス、経済学のオープンソースコミュニティがあり、オープンソースのメガネブランドすらあります。機械学習と人工知能をサポートする大規模なオープンソースコミュニティもあります。特に有名な 2 つのオープンソースフレームワークに Python scikit-learn と多数の R 機械学習パッケージがあります。他にも、Tensorflow ライブラリから数え切れないほどの個人およびグループの貢献者まで、さまざまな規模にわたって数多く存在しています。
オープンソースモデルインフラストラクチャが重要である理由
機械学習テクノロジの中心にあるのが、オープンソースコミュニティが開発したアルゴリズムです。アルゴリズムにより、アナリストは履歴データからパターンとインサイトを見つけ出すことができます。このコミュニティには、学術機関、Google 社、Microsoft 社、Yahoo 社などの企業や個人の開発者が参加しています。コミュニティは情報開示と連携を重視しています。誰もがこれらのアルゴリズムを使用して、何がうまく機能し、何がうまく機能しないかを検証して発見し、それを繰り返して、より良いアルゴリズムを新たに作り続けることができます。
DataRobot + オープンソースモデルインフラストラクチャ
オープンソースモデルインフラストラクチャは、DataRobot プラットフォームに不可欠な基盤です。オープンソースアルゴリズムは入手可能な最高のアルゴリズムであるため、ほとんどのモデルに使用されています。DataRobot のモデルブループリントに含まれているアルゴリズムは、データの前処理ステップと機械学習アルゴリズムを自動的に組み合わせたもので、Python、R などのプログラミング言語、Tensorflow、XGBoost、DMTK、Vowpal Wabbit などのライブラリで利用可能なソフトウェアを含む、さまざまなオープンソースソフトウェアフレームワークから取り入れられたものです。