DataRobot AI Cloud – 2022 年 7 月リリース

新しい NLP のハイパーパラメーターと自動化機能によって、DataRobot AI Cloud を使用した新しい AI の実験が大幅に迅速化され、テキストデータの予測の説明が次のレベルに引き上げられます。これにより、顧客のレビューや製品のフィードバックにおける肯定的な意見と否定的な意見のパターンなど、テキストの影響を理解できるようになりました。より詳細なインサイトを利用することで、新しいユースケースを確認し、テキストの特徴量の信頼性、使いやすさ、説明可能性を高めることができます。

また、大きなデータセットを含む時系列モデルのスコアリングコードが改善され、スケールとスピードが向上しました。この時系列モデルのスコアリングコードをダウンロードすれば、DataRobot AI Cloud 以外の任意の環境で大規模なデータセットを使って予測を実行できます。 

DataRobot AI Cloud プラットフォームならではのその他の機能については、以下をご覧ください。

Text AI

テキストの予測の説明(パブリックプレビュー)

テキストデータは多くの情報を伝えます。また、モデルを構築すればするほど、使用する情報は増えることになります。そのため、機械学習モデルがテキストを解釈する方法やその予測の精度について説明できることがきわめて重要です。DataRobot では、専用の機能である高度なテキストの予測により、テキストとそのテキストがモデルにもたらす否定的および肯定的な影響の両方を、詳細なインサイトを利用して単語または語句レベルで理解できるようになりました。GUI または API 経由で詳細なインサイトを利用して説明の限界を見極めることで、より適切に意思決定を行い、モデルに対する信頼性を築くことができます。また、高度なテキストの予測の説明により、AI プロジェクトの実験を行いながら、新しいユースケースやパターンを見つけ出すことができます。 

映画のレビューを例に説明しましょう。この例は、モデルを使用してレビューのテキストに含まれる感情を予測したものです。テキストの予測の説明では、「movie」という単語(および赤で強調表示されたその他の単語)が予測に強い肯定的な影響を、「right」という単語(および青で強調表示されたその他の単語)が予測に強い否定的な影響をもたらしていることが示されています。

オートパイロット用に強化された言語検出(GA)

ビジネスをグローバルに展開しているために、データセットが複数の異なる言語に分かれていても、もはや問題ではありません。テキストの言語を手動で識別し、膨大な時間を費やしてモデルを調整することなく、最適なハイパーパラメーター値を見つけられるようになりました。言語検出が可能なトップレベルのディープラーニングモデルによって、ハイパーパラメーターが自動的に最適化されるため、すぐに作業に取りかかることができます。また、データセットに複数の言語を含め、残りの作業を AI Cloud プラットフォームに任せることも可能です。これは DataRobot 専用の機能で、すべてのユーザーが利用できます。

Composable ML での新しいテキスト前処理タスク(GA)

Composable ML を使用してモデル構築の実験を次のステップに進めたい方や、活用したいテキストデータがある方に朗報です。新しい Text AI タスクの導入により、さまざまな方法でテキストを特徴量化したり、さらに多様なブループリントを作成したりする作業が容易になりました。見出し語化、品詞タグ付け、語幹抽出に対応した新しいタスクが Composable ML で利用できます。

時系列

時系列スコアリングコード(GA)

時系列モデルのエクスポートと利用が数回のクリックで完了します。時系列モデルのスコアリングコードが、大きなデータセットでスケーラブルに実行されるようになりました。そのため、Java ベースのスコアリングコードパッケージで時系列モデルを直接エクスポートし、任意の環境で予測を実行できます。

また、モデルの管理に必要な時間とリソースが削減されます。​​スコアリングコードは、リーダーボードまたはデプロイから数回のクリックで簡単にダウンロードできます。時系列スコアリングコードを使用すれば、プライベートクラウドやハイブリッドクラウドなど DataRobot AI Cloud プラットフォーム以外の任意の環境で予測を生成できます。また、MLOps エージェントを使用してモニタリングを行うことも可能です。