Computer Visionとは?画像AIでできること|Azure AI-900対策

  • URLをコピーしました!
目次

この記事でわかること

この記事では、Computer Vision(コンピュータビジョン)とは何か、 画像AIでどのようなことができるのかを、 AI初学者向けに体系的に解説します。

AI-900試験で頻出となる 画像分類・物体検出・OCRなどの概念と、 Azureで提供されている画像AIサービスとの関係を 一度で理解できる内容になっています。

📌 他のAI-900出題分野もあわせて確認したい方へ
機械学習・Azure AIサービス・Responsible AIなど、試験範囲を網羅した総合ガイドはこちら。
AI-900試験対策まとめ

Computer Visionとは何か

Computer Visionとは、 画像や映像をAIに理解させる技術分野 のことです。

人間が目で見て判断していることを、 コンピュータがデータとして解析し、 意味を理解しようとします。

AI-900では、 Computer Visionは 代表的なAIワークロードの1つ として扱われます。

人間とAIの「画像の見え方」の違い

人間は画像を見た瞬間に、

  • 何が写っているか
  • どこにあるか
  • 文字や意味

を直感的に理解します。

一方、AIにとって画像は、 ピクセル(数値)の集合 です。

Computer Visionは、 この数値データから 特徴を抽出し、意味づけを行う技術 だと理解するとわかりやすいです。

画像AIでできる代表的なこと

① 画像分類(Image Classification)

画像全体を見て、 何が写っているかを分類 する技術です。

  • 犬か猫か
  • 正常/異常
  • 製品の種類判別

AI-900では、 分類は最も基本的な画像AIの用途 として押さえておく必要があります。

② 物体検出(Object Detection)

画像の中に 何が・どこにあるか を検出する技術です。

  • 人の検出
  • 車・信号機の検出
  • 不審物の位置特定

分類との違いは、 位置情報(バウンディングボックス) を持つ点です。

③ 顔検出・属性解析

顔が写っているかを検出し、

  • 顔の位置
  • 人数
  • 表情や向き

などを解析します。

※近年はプライバシー配慮の観点が重要で、 Azureでも利用制限があります。

④ OCR(文字認識)

画像の中に含まれる 文字を読み取る技術 です。

  • 請求書
  • 名刺
  • 手書き文字

AI-900では、 OCRは Computer Visionの代表的ユースケース として頻出です。

⑤ 画像解析(タグ付け・説明生成)

画像の内容を解析し、

  • タグを自動付与
  • 画像の説明文を生成

といった処理も可能です。

これは生成AIと組み合わせた 高度な画像理解 につながります。

Azureにおける画像AIサービス

Azureでは、 Computer Visionを 簡単に利用できるサービス が提供されています。

  • Azure AI Vision
  • Vision Studio
  • カスタム画像モデル

AI-900では、 「コードを書かなくても使えるAIサービス」 として理解しておくことが重要です。

Computer Visionの活用例

  • 製造業での外観検査
  • 小売業での商品棚分析
  • セキュリティ監視
  • 書類のデジタル化

実務では、 人が目視していた作業を自動化 する場面で多く活用されています。

AI-900試験での重要ポイント

  • Computer Visionは画像・映像を扱うAI
  • 画像分類・物体検出・OCRを区別できる
  • Azure AI Visionが代表的サービス
  • ユースケース理解が問われる

まとめ

  • Computer Visionは画像を理解するAI技術
  • 分類・検出・OCRが基本機能
  • Azureでは簡単に利用可能
  • AI-900では概念理解が合格の鍵

AI-900を体系的に学びたい方へ
この記事は「AI-900試験対策」シリーズの一部です。
▼AI-900完全ロードマップはこちら

AI-900準拠!Azure AI演習 Vol.1【全10問】

最新の試験範囲からランダムで10問を出題。
本番レベルの問題で、現在の理解度を5分でチェック!
全問正解して合格への自信を掴みましょう。

1 / 10

機械学習において、猫の画像を「猫」と正しく認識した割合など、正解率を示す指標は?

2 / 10

音声データの内容を、指定した別の言語に直接翻訳して出力する機能は?

3 / 10

Azure AI Speechにおいて、あらかじめ用意された声ではなく「自分自身の声」をデジタル合成する機能は?

4 / 10

責任あるAIの「プライバシーとセキュリティ」において、AIに学習させるデータの保護で重要なのは?

5 / 10

Azure AI Languageにおいて、住所や電話番号などの「個人を特定できる情報」を自動で隠す機能は?

6 / 10

機械学習において、モデルに予測の手掛かりとして与える「入力データ」の列を何と呼ぶか?

7 / 10

Azure Machine Learningで、モデルのトレーニング履歴やメトリックを記録する単位は?

8 / 10

Azure AIサービスをREST API経由で呼び出す際、接続先を示すURLを何と呼ぶか?

9 / 10

Azure OpenAI Serviceが提供する、テキスト、画像、音声を統合して扱えるモデルの性質を何と呼ぶか?

10 / 10

コンピュータビジョンの「物体検出」において、物体を囲む四角い枠のことを何と呼ぶか?

あなたのスコアは

平均スコアは 81%

0%

目次