この記事でわかること
この記事では、Computer Vision(コンピュータビジョン)とは何か、 画像AIでどのようなことができるのかを、 AI初学者向けに体系的に解説します。
AI-900試験で頻出となる 画像分類・物体検出・OCRなどの概念と、 Azureで提供されている画像AIサービスとの関係を 一度で理解できる内容になっています。
Computer Visionとは何か
Computer Visionとは、 画像や映像をAIに理解させる技術分野 のことです。
人間が目で見て判断していることを、 コンピュータがデータとして解析し、 意味を理解しようとします。
AI-900では、 Computer Visionは 代表的なAIワークロードの1つ として扱われます。
人間とAIの「画像の見え方」の違い
人間は画像を見た瞬間に、
- 何が写っているか
- どこにあるか
- 文字や意味
を直感的に理解します。
一方、AIにとって画像は、 ピクセル(数値)の集合 です。
Computer Visionは、 この数値データから 特徴を抽出し、意味づけを行う技術 だと理解するとわかりやすいです。
画像AIでできる代表的なこと
① 画像分類(Image Classification)
画像全体を見て、 何が写っているかを分類 する技術です。
- 犬か猫か
- 正常/異常
- 製品の種類判別
AI-900では、 分類は最も基本的な画像AIの用途 として押さえておく必要があります。
② 物体検出(Object Detection)
画像の中に 何が・どこにあるか を検出する技術です。
- 人の検出
- 車・信号機の検出
- 不審物の位置特定
分類との違いは、 位置情報(バウンディングボックス) を持つ点です。
③ 顔検出・属性解析
顔が写っているかを検出し、
- 顔の位置
- 人数
- 表情や向き
などを解析します。
※近年はプライバシー配慮の観点が重要で、 Azureでも利用制限があります。
④ OCR(文字認識)
画像の中に含まれる 文字を読み取る技術 です。
- 請求書
- 名刺
- 手書き文字
AI-900では、 OCRは Computer Visionの代表的ユースケース として頻出です。
⑤ 画像解析(タグ付け・説明生成)
画像の内容を解析し、
- タグを自動付与
- 画像の説明文を生成
といった処理も可能です。
これは生成AIと組み合わせた 高度な画像理解 につながります。
Azureにおける画像AIサービス
Azureでは、 Computer Visionを 簡単に利用できるサービス が提供されています。
- Azure AI Vision
- Vision Studio
- カスタム画像モデル
AI-900では、 「コードを書かなくても使えるAIサービス」 として理解しておくことが重要です。
Computer Visionの活用例
- 製造業での外観検査
- 小売業での商品棚分析
- セキュリティ監視
- 書類のデジタル化
実務では、 人が目視していた作業を自動化 する場面で多く活用されています。
AI-900試験での重要ポイント
- Computer Visionは画像・映像を扱うAI
- 画像分類・物体検出・OCRを区別できる
- Azure AI Visionが代表的サービス
- ユースケース理解が問われる
まとめ
- Computer Visionは画像を理解するAI技術
- 分類・検出・OCRが基本機能
- Azureでは簡単に利用可能
- AI-900では概念理解が合格の鍵
次の記事では、 Azure AI Visionで何ができるのか をより具体的に解説していきます。
