(このブログポストは DataRobot Integrates Feature Discovery Capability with Snowflake の和訳です)
DataRobot とデータクラウド企業の Snowflake が 2018 年に新たなパートナーシップを発表した際、「企業内での AI の導入を加速させる」という目標を掲げました。両社は、それから 2 年以上にわたり緊密に協力し合い、お客様のニーズに応えるためのシームレスな連携について理解を深めてきました。
数か月にわたる有益なコラボレーションを経て、DataRobot と Snowflake はこの度、両社のパートナーシップの下で初となる製品連携を発表しました。DataRobot の特徴量探索(特徴量エンジニアリングの自動化により、機械学習モデルで使用する重要な特徴量の新規作成が可能)が、Snowflake で利用できるようになりました。これにより、Snowflake の顧客は AI と機械学習を活用してイノベーションを加速させ、ビジネスを促進する予測インサイトを手にすることができます。
DataRobot の特徴量探索: 次世代の特徴量エンジニアリングの自動化
特徴量エンジニアリングは AI において最も重要なタスクの 1 つです。なぜなら、作成する特徴量によって、機械学習プロジェクトの成否が決まることがよくあるからです。
問題は、データに適切な特徴量が存在することは稀であり、複数のデータソースを 1 つのデータセットに統合してモデルをトレーニングし、予測を行う必要があることです。これには通常、複数のテーブルを結合させ、異なる派生ウィンドウ(直近の 30 日間、先週など)で多くの集計データ(合計値、最大値、平均値、カウント、エントロピーなど)を探索することが含まれます。
DataRobot の自動特徴量探索は、エキスパートレベルのデータサイエンスのベストプラクティスを自動化することで、特徴量エンジニアリングのプロセスを簡素化して高速化します。
一般的な特徴量エンジニアリングの自動化ソリューションと比較して、DataRobot の場合、1 つだけでなく複数のデータセットからデータを活用して、機械学習モデルで使用する数百の重要な特徴量を新たに見つけ、テストし、作成することで、それらモデルの精度を劇的に向上させることができます。
Snowflake でさらに高速化
複数のデータソースを探索するには、常に大量のデータをシステム間で転送する必要があり、これには多くのリソースと時間がかかりました。
DataRobot と Snowflake との新たな連携により、特徴量探索の処理を Snowflake に組み込むことで、データの移動を最小限に抑えることができます。その結果、素早く結果を導き出せるので、運用コストを削減できます。
特徴量探索は、データサイエンスのプロセスに自動化をもたらすという観点において、さまざまな意味で DataRobot の AutoML(Automated Machine Learning)製品の拡張機能と言えます。この連携により、Snowflake のデータクラウドからより精度の高いモデルを開発できます。
特徴量探索機能について詳しくは、特徴量探索の製品ページをご覧ください。
イベント
DataRobot AI Experience Japan
DataRobot x Snowflake コラボセッション:
データをつなぐグローバルネットワークでAIサイクルを高速化
登録はこちら