画像分類・物体検出・顔検出の違い|Azure AI-900対策

  • URLをコピーしました!
目次

この記事でわかること

この記事では、AI-900試験で必ず問われる 画像分類・物体検出・顔検出の違いについて、 「何をする技術なのか」「何が出力されるのか」「どんな場面で使うのか」 という観点から、初学者でも確実に理解できるよう解説します。

似た言葉で混乱しやすいこの3つを、 試験で迷わないレベルまで整理することを目的としています。

画像AIの3つの基本パターン

Computer Vision(画像AI)の機能は、大きく分けると 次の3つに分類できます。

  • 画像分類(Image Classification)
  • 物体検出(Object Detection)
  • 顔検出(Face Detection)

AI-900では、 「何を判定するAIなのか」を正しく区別できるかが重要です。

① 画像分類とは

何をする技術か

画像分類とは、 画像全体を見て「何の画像か」を1つのカテゴリに分類する技術です。

出力される情報

  • 画像のカテゴリ(ラベル)
  • 確信度(スコア)

イメージ

「この画像はです」 「この画像は異常品です」

特徴

  • 位置情報はわからない
  • 画像全体を1つとして判断

AI-900でのポイント

「画像に何が写っているかを分類する」 という説明があれば、画像分類を選びます。

② 物体検出とは

何をする技術か

物体検出とは、 画像の中に「何が」「どこに」あるかを検出する技術です。

出力される情報

  • 物体の種類
  • 位置(四角形:バウンディングボックス)

イメージ

「この画像には人が2人いて、 それぞれこの位置にいます」

特徴

  • 複数の物体を同時に検出可能
  • 位置情報が重要

AI-900でのポイント

「場所」「検出」「どこにあるか」という表現があれば、 物体検出を選びます。

③ 顔検出とは

何をする技術か

顔検出とは、 画像の中に人の顔があるかを検出することに特化した技術です。

出力される情報

  • 顔の位置
  • 顔の数
  • 向き・表情などの属性(制限あり)

イメージ

「この写真には3人の顔が写っています」

特徴

  • 人の顔に特化
  • プライバシー配慮が重要

AI-900でのポイント

「顔」「人物の顔」「人数カウント」 という表現があれば、顔検出です。

3つの違いを一目で比較

項目画像分類物体検出顔検出
何を判断する?画像全体画像内の物体人の顔
位置情報なしありあり
複数検出不可可能可能
主な用途分類検出・追跡人数・顔解析

Azure AI Visionとの対応関係

  • 画像分類 → Image Analysis
  • 物体検出 → Object Detection
  • 顔検出 → Face Detection

AI-900では、 「どのAzureサービスを使えばよいか」 という形で問われることがあります。

AI-900試験での典型的な引っかけ

  • 「画像に何があるか」→ 分類ではなく検出
  • 「人が写っているか」→ 顔検出
  • 「どこにあるか」→ 物体検出

位置情報が必要かどうかを考えると、 正解を選びやすくなります。

まとめ

  • 画像分類:画像全体を1つに分類
  • 物体検出:何がどこにあるか
  • 顔検出:人の顔に特化
  • AI-900では用途の見分けが最重要

この3つの違いを正確に理解できれば、 画像AIに関する問題はほぼ確実に得点できます。

目次