この記事でわかること
この記事では、AI-900(Azure AI Fundamentals)の試験範囲に含まれる Azure AI Visionについて、
どのような画像AI機能が提供されているのかを 一覧形式で整理し、 「どの機能を、どんな用途で使うのか」を 初学者でもイメージできるように解説します。
Azureの画像AIサービスを体系的に理解することで、 試験対策だけでなく、実務でのサービス選定力も身につきます。
Azure AI Visionとは
Azure AI Visionとは、 画像や映像を解析するAI機能をまとめたAzureのマネージドサービス です。
プログラミングの知識がなくても試せるUI(Vision Studio)と、 アプリケーションから利用できるAPIの両方が提供されています。
AI-900では、 「画像に関するAIはAzure AI Vision」 という大枠の理解が重要です。
Azure AI Visionの代表的な機能一覧
Azure AI Visionでは、主に次のような機能が提供されています。
- 画像分析(Image Analysis)
- 画像分類(Image Classification)
- 物体検出(Object Detection)
- OCR(文字認識)
- 顔検出(Face Detection)
それぞれの機能を順に見ていきましょう。
① 画像分析(Image Analysis)
画像分析は、 画像全体の内容をAIが理解し、情報を抽出する機能 です。
具体的には、次のような解析が行われます。
- 画像の内容説明(キャプション生成)
- タグ付け(例:人、車、建物)
- 画像の属性判定(屋内・屋外など)
「この画像に何が写っているかをざっくり知りたい」 という用途に向いています。
② 画像分類(Image Classification)
画像分類は、 画像全体を1つのカテゴリに分類する機能 です。
例えば、
- 犬か猫かを判定する
- 製品画像の種類を分類する
といった用途で利用されます。
AI-900では、 「画像全体をラベル分けする」=画像分類 と覚えておくと整理しやすいです。
③ 物体検出(Object Detection)
物体検出は、 画像の中にある物体を検出し、その位置を特定する機能 です。
画像分類との大きな違いは、
- 何があるか
- どこにあるか
の両方がわかる点です。
例としては、
- 画像内の人物の位置検出
- 工場内の異物検知
などが挙げられます。
④ OCR(文字認識)
OCR(Optical Character Recognition)は、 画像内の文字を読み取り、テキストデータに変換する機能 です。
Azure AI Visionでは、 Read API として提供されています。
主な用途は、
- 請求書や領収書の読み取り
- 名刺のデータ化
- 紙書類の電子化
AI-900では、 「文字」「書類」「読み取り」というキーワードが出たら OCRを選ぶのが基本です。
⑤ 顔検出(Face Detection)
顔検出は、 画像内に顔が存在するかを検出する機能 です。
AI-900の範囲では、
- 顔があるかどうかの検出
- 顔の位置の特定
までが主な対象となります。
個人識別や感情推定といった高度な処理は、 Responsible AIの観点から制限されている 点も重要なポイントです。
Azure AI Visionの機能まとめ表
| 機能 | できること |
|---|---|
| 画像分析 | 画像全体の内容を理解 |
| 画像分類 | 画像をカテゴリ分け |
| 物体検出 | 物体の種類と位置を検出 |
| OCR | 画像内の文字を読み取り |
| 顔検出 | 顔の有無と位置を検出 |
AI-900試験での押さえどころ
- 画像AIはAzure AI Vision
- 用途と機能を結びつけて覚える
- 「分類」「検出」「文字」の違いを意識する
細かいAPI名や実装方法は不要で、 「この要件ならこの機能」 と判断できることが合格のポイントです。
まとめ
- Azure AI Visionは画像AIの総合サービス
- 代表的な5つの機能を理解することが重要
- AI-900では用途ベースの理解が問われる
