教師あり学習・教師なし学習・強化学習の違い

  • URLをコピーしました!
目次

この記事でわかること

この記事では、機械学習における代表的な3つの学習方法である「教師あり学習」「教師なし学習」「強化学習」について、 それぞれの仕組み・特徴・適した用途を整理します。 AI-900試験で頻出となる「この課題にはどの学習方法が適切か」という問題を、 用語暗記ではなく理解ベースで解けるようになることを目的としています。

結論:違いは「正解データの有無」と「学習の目的」

3つの学習方法の違いは非常にシンプルで、次の2点で整理できます。

  • 正解(ラベル)データがあるか
  • 何を最適化するために学習するか

全体像を図解イメージで理解する

機械学習
 ├ 教師あり学習(正解あり)
 ├ 教師なし学習(正解なし)
 └ 強化学習(報酬で学習)

① 教師あり学習(Supervised Learning)

概要

教師あり学習とは、入力データと正解(ラベル)をセットで学習させる方法です。 AIは「この入力なら、この答え」という対応関係を学習します。

特徴

  • 正解データが必要
  • 結果の精度を評価しやすい
  • 実務で最も利用されている

代表的なタスク

  • 分類(例:スパム/非スパム)
  • 回帰(例:売上予測、価格予測)

具体例

過去のメールデータに「スパム」「正常」という正解ラベルを付けて学習し、 新しいメールを自動判定する。

Azureでの例

  • Azure Machine Learning(分類・回帰モデル)

AI-900重要ポイント:
正解データが明示的に存在する場合は、教師あり学習。

② 教師なし学習(Unsupervised Learning)

概要

教師なし学習とは、正解データを与えず、データの構造や傾向を自動的に見つける学習方法です。

特徴

  • 正解ラベルが存在しない
  • データの「まとまり」や「異常」を発見
  • 分析・探索用途に強い

代表的なタスク

  • クラスタリング
  • 異常検知

具体例

顧客データを分析し、購買傾向が似ているグループを自動的に分類する。

Azureでの例

  • Azure Machine Learning(クラスタリング)

AI-900重要ポイント:
「正解はわからないが、傾向を知りたい」場合は教師なし学習。

③ 強化学習(Reinforcement Learning)

概要

強化学習とは、行動の結果として得られる報酬を最大化するように学習する方法です。

特徴

  • 正解ラベルは存在しない
  • 「良い/悪い」の評価(報酬)で学習
  • 試行錯誤型

代表的なタスク

  • ゲームAI
  • ロボット制御
  • 最適ルート探索

具体例

ゲームで勝利すると報酬が与えられ、負けると報酬が減る。 この繰り返しで最適な戦略を学習する。

Azureでの位置づけ

AI-900では深掘りはされませんが、概念理解レベルで問われます。

AI-900重要ポイント:
「報酬を最大化する」「試行錯誤」というキーワード。

3つの学習方法の比較まとめ

項目教師あり教師なし強化学習
正解データありなしなし
学習目的正解を当てる構造を見つける報酬を最大化
代表用途分類・予測分析・異常検知制御・最適化

試験でよくある出題パターン

問題例:
「正解ラベルが存在せず、データの傾向を把握したい。この場合に適した学習方法は?」

正解:
教師なし学習

まとめ

  • 教師あり学習:正解データあり
  • 教師なし学習:正解データなし
  • 強化学習:報酬で学習

この3分類を正しく理解すれば、AI-900の学習手法問題は確実に得点源になります

目次