(このブログポストは Introducing the Next Generation of Text AI for AI Cloud Platform の和訳です)
さらに進化した Text AI
組織が持つ情報の80%がテキストで保存されていると言われています。テキストデータは蓄積が容易な一方、人間の言語のあいまいさにより、分析は非常に困難な場合があります。大量かつ複雑な非構造化データを扱うからこそ、DataRobot はユーザーがテキストからインサイトを引き出す手助けをすることに注力してきました。DataRobot のインテリジェントな AutoML を、テキストデータに対して教師ありモードまたは教師なしモードで使用し(他のデータ型と組み合わせることもできます!)、ボタンを 1 回クリックするだけでモデルをトレーニングできます。さらに、上級ユーザーであれば、パラメーターをチューニングすることや、 DataRobot がどのようにデータを処理し、どのようにモデルを構築するかを Composable ML で自由に設定することも可能です。データ、モデル 、ブループリントに関する説明はプラットフォーム全体で充実しており、いつでも結果を理解できます。テキストデータに DataRobot を使用することで、モデルの可能性を最大限に引き出しましょう。
7.3 の新機能でテキストデータの価値を引き出す
多様な言語とデータ型
DataRobot では、各言語のテキストに制限や注意点を設けることは考えていません。そのため、プラットフォーム全体を通じて言語に依存しない技術を使用するようにしており、プラットフォームのパワーを常に最大限に活用できます。DataRobot に取り込む言語に関係なく、同様の優れた結果を常に期待できます。
多くの場合、テキストデータだけで十分とは限らず、他のデータ型と組み合わせて使用したい場合もあると思います。Text AI では、データセットに含まれている他の特徴量型のデータとテキストデータを自由に組み合わせることができます。数値、カテゴリー、日付、画像、地理空間、時系列 、リレーショナルなど、DataRobot がサポートするすべての特徴量型のデータとテキストデータの組み合わせが可能です。多様な特徴量型を使用することで、AI モデルをより広い視野で見ることができます。
より少ない労力でより多くの価値を生み出す
DataRobot の幅広いオプションを利用して実験してみましょう。DataRobot の AutoML や AutoTS を使用して、分類、予測、連続値などさまざまなデータサイエンス の問題に取り組みましょう。膨大なテキストデータのどこから手をつけていいかわからない場合は、DataRobot の教師なしモードを起動し、クラスタリングや異常検知を利用すれば、データのパターンとインサイトを見つけることができます。何よりも、ノーコード、ローコード、フルコードのいずれで進める場合でも、これらの手法はテキストに対してすぐに使用できます。中間技術的なテキスト特徴量の抽出手法から解放され、組織のビジネス問題の解決に集中できます。インフラストラクチャとディープラーニング技術への対応はプラットフォーム に任せ、組織に価値をもたらすことに最大限の力を注ぐことが可能です。
より高度な作業が可能
DataRobot の Text AI では、さまざまなテキストおよび NLP (英語)手法 (”bag-of-words” モデル、tf-idf、コサイン類似度、FastText、TinyBert、NLTK、spaCy、ストップワードの除去、語幹処理、レンマ化など)をテストできます。これらの手法はすべてプラットフォームに組み込まれており、特定のニーズに合わせて容易に利用および設定できます。
説明可能性と信頼の向上
Text AI により、お客様のテキストデータを DataRobot プラットフォーム がどのように利用し、その結果どのような洞察が得られたかが簡単に理解できるようになりました。テキストによる説明は、プラットフォーム全体、およびモデルの構築と評価のプロセス全体に組み込まれており、以下の内容が含まれます。
DataRobot は、お客様がテキスト特徴量について理解し、それを他の特徴量と組み合わせるとどのように機能するかがわかるように、あらゆる段階でサポートします。テキストによる説明(およびプラットフォーム全体での説明可能性)は常に更新しています。今後、さらにエキサイティングな説明機能が追加される予定です。
さまざまな業界でさらに価値を創出
DataRobot は多くの業界のさまざまなユースケース(活用方法) に対応しています。個人的に非常に興味深いと感じたユースケースをいくつか紹介します。
採用候補者の推薦 – DataRobot モデルは、ラベル付きの履歴書(採用または不採用)をテキストデータとして使用することで、過去の採用傾向を学習し、採用候補者を予測・推薦することができます。DataRobot は、td-idf と固有表現抽出技術を組み合わせることで、採用担当者による応募者評価方法 を理解するためのモデルを構築し、それを予測で再現することができます。
サポートチケットのルーティング – ラベル付きのサポートチケットに基づいて構築された DataRobot モデルは、組織がトピックを特定し、解決に適したサポートアシスタントへ正しくルーティングするのに役立ちます。サポートチケットの説明に基づくトピックモデリング(テキストによるクラスタリングを使用)をラベルなしのサポートチケットで使用して全般的な傾向を見つけ、サポートチームが新しい問題や新たに発生したテーマを特定できるよう支援することもできます。
Text AI を今すぐ始めましょう
AI Cloud プラットフォーム を導入済みなら、すぐに Text AI の使用を開始できます。新しいリリース 7.3 に含まれており、すべてのエディション、オンプレミスとクラウドのすべてのデプロイオプションで利用可能です。Text AI を使用するためにライセンスの追加は必要ありません。
Text AI の詳細はこちら からご確認いだけます。
オンデマンド
DataRobot AIX 22 Japan オンデマンド
AIの可能性を示す基調講演や、業界事例を紹介したお客様講演を多数ご視聴いただけます。
オンデマンドで見る
DataRobot リリース
新機能および強化機能の一覧を見る
もっと詳しく
執筆者について
Jon Chang(ジョン・チャン)
シニアプロダクトマネージャー
Jon は、DataRobot のシニアプロダクトマネージャーで、ディープラーニング分野での製品戦略を主に担当しています。製品管理に 10 年携わった経験から、優れた製品を作り、お客様に価値を提供することに絶対的なこだわりを持ち、AI に関するすべてに情熱を注いでいます。デジタル製品戦略コンサルティングサービスの提供、フィンテックデジタル製品の開発、気象分析のスタートアップ企業での勤務を経て、DataRobot に入社しました。
Jon Chang(ジョン・チャン) についてもっとくわしく