教師あり機械学習と教師なし機械学習の違い

教師なし機械学習は、各データポイントの正解が過去のデータでは不明あるいは存在しない場合に使用します。それに対して、教師あり機械学習は、過去のデータで正解がわかっている場合に使用します。

教師なし機械学習

Q: 教師なし機械学習とは

教師なし機械学習アルゴリズムは、既知の（つまり正解ラベル付きの）結果が存在しないデータセットからパターンを推測します。

教師なし機械学習とは

教師なし機械学習アルゴリズムは、既知つまりラベル付きの結果を参照せずにデータセットからパターンを推察します。教師あり機械学習とは異なり、教師なし機械学習手法を回帰や分類の問題に直接適用することはできません。出力データの値がどのようなものになるかわからないため、通常の方法ではアルゴリズムをトレーニングできません。しかし、教師なし学習は、データの基盤となる構造を見つける場合には使用できます。

教師なし機械学習が重要である理由

教師なし機械学習は、データ内の未知のパターンを見つけ出すことを目的としていますが、ほとんどの場合、これらのパターンは教師あり機械学習が達成できる結果の近似値ではありますが質は低くなります。さらに、結果がどのようなものであるべきかわからないため、結果がどのぐらい高精度かを判断する方法がなく、実際の問題には教師あり機械学習がより適しています。

教師なし機械学習の使用が最適なのは、これまで販売したことのないまったくの新製品のターゲット市場を決めるなど、望ましい結果に関するデータがない場合です。ただし、既存の消費者ベースについての理解を深めようとする場合であれば、教師あり学習が最適な手法です。

教師なし機械学習手法の応用をいくつか紹介します。

クラスタリングでは、類似性に基づいてデータセットを自動的にグループに分割できます。ただし、多くの場合、クラスター分析では、グループ間の類似性が過大評価され、データポイントが個別に扱われません。このため、クラスター分析は、顧客のセグメント化やターゲット化といった応用には適していません。
異常検知は、データセット内の異常なデータポイントを自動的に検出できます。これは、詐欺取引の特定、ハードウェアの故障部品検出、またはデータ入力中の人的エラーによる異常値の識別に役立ちます。
アソシエーションマイニングは、データセット内で頻繁に同時発生するアイテムセットを識別します。小売業者がバスケット分析によく使用します。アナリストが、同時に購入されることが多い商品を見つけ出し、それに従って、より効果的なマーケティング戦略やマーチャンダイジング戦略を開発できるためです。
潜在的変数モデルは、データセット内の特徴量の数を減らす（次元削減）、データセットを複数のコンポーネントに分解するなど、データ処理で一般的に使用されます。

教師なし機械学習手法によって見つけ出されるパターンは、後で教師あり機械学習を実装する場合にも役立つことがあります。たとえば、教師なし手法を使用してデータのクラスター分析を実行し、各行が属するクラスターを教師あり学習モデルで追加の特徴量として使用することができます（詳細については、「半教師あり機械学習」を参照してください）。もう 1 つの例は、追加特徴量として異常検知スコアを使用する不正行為検出モデル（英語）です。

教師なし機械学習 + DataRobot

DataRobot の機械学習自動化プラットフォームは「ターゲット」列を必要とします。つまり、データ内のパターンを見つけ出すには出力の変数を知っている必要があります。ただし、ほとんどのモデルブループリントでは教師なし学習を利用して複雑な特徴量エンジニアリング技法を自動化します。自動化しなければ、特徴量エンジニアリングの実装は困難で長い時間を要します。