目次
この記事でわかること
この記事では、AI-900試験で必ず問われる 画像分類・物体検出・顔検出の違いについて、 「何をする技術なのか」「何が出力されるのか」「どんな場面で使うのか」 という観点から、初学者でも確実に理解できるよう解説します。
似た言葉で混乱しやすいこの3つを、 試験で迷わないレベルまで整理することを目的としています。
画像AIの3つの基本パターン
Computer Vision(画像AI)の機能は、大きく分けると 次の3つに分類できます。
- 画像分類(Image Classification)
- 物体検出(Object Detection)
- 顔検出(Face Detection)
AI-900では、 「何を判定するAIなのか」を正しく区別できるかが重要です。
① 画像分類とは
何をする技術か
画像分類とは、 画像全体を見て「何の画像か」を1つのカテゴリに分類する技術です。
出力される情報
- 画像のカテゴリ(ラベル)
- 確信度(スコア)
イメージ
「この画像は犬です」 「この画像は異常品です」
特徴
- 位置情報はわからない
- 画像全体を1つとして判断
AI-900でのポイント
「画像に何が写っているかを分類する」 という説明があれば、画像分類を選びます。
② 物体検出とは
何をする技術か
物体検出とは、 画像の中に「何が」「どこに」あるかを検出する技術です。
出力される情報
- 物体の種類
- 位置(四角形:バウンディングボックス)
イメージ
「この画像には人が2人いて、 それぞれこの位置にいます」
特徴
- 複数の物体を同時に検出可能
- 位置情報が重要
AI-900でのポイント
「場所」「検出」「どこにあるか」という表現があれば、 物体検出を選びます。
③ 顔検出とは
何をする技術か
顔検出とは、 画像の中に人の顔があるかを検出することに特化した技術です。
出力される情報
- 顔の位置
- 顔の数
- 向き・表情などの属性(制限あり)
イメージ
「この写真には3人の顔が写っています」
特徴
- 人の顔に特化
- プライバシー配慮が重要
AI-900でのポイント
「顔」「人物の顔」「人数カウント」 という表現があれば、顔検出です。
3つの違いを一目で比較
| 項目 | 画像分類 | 物体検出 | 顔検出 |
|---|---|---|---|
| 何を判断する? | 画像全体 | 画像内の物体 | 人の顔 |
| 位置情報 | なし | あり | あり |
| 複数検出 | 不可 | 可能 | 可能 |
| 主な用途 | 分類 | 検出・追跡 | 人数・顔解析 |
Azure AI Visionとの対応関係
- 画像分類 → Image Analysis
- 物体検出 → Object Detection
- 顔検出 → Face Detection
AI-900では、 「どのAzureサービスを使えばよいか」 という形で問われることがあります。
AI-900試験での典型的な引っかけ
- 「画像に何があるか」→ 分類ではなく検出
- 「人が写っているか」→ 顔検出
- 「どこにあるか」→ 物体検出
位置情報が必要かどうかを考えると、 正解を選びやすくなります。
まとめ
- 画像分類:画像全体を1つに分類
- 物体検出:何がどこにあるか
- 顔検出:人の顔に特化
- AI-900では用途の見分けが最重要
この3つの違いを正確に理解できれば、 画像AIに関する問題はほぼ確実に得点できます。
