学習データとテストデータの違い|Azure AI-900対策

  • URLをコピーしました!
目次

この記事でわかること

この記事では、機械学習における 学習データとテストデータの役割の違いを、 初学者でもイメージできるように解説します。 AI-900試験で頻出の「評価の考え方」を理解することが目的です。

📌 他のAI-900出題分野もあわせて確認したい方へ
機械学習・Azure AIサービス・Responsible AIなど、試験範囲を網羅した総合ガイドはこちら。
AI-900試験対策まとめ

なぜデータを分ける必要があるのか

機械学習では、 AIがどれだけ賢くなったかを正しく判断する必要があります。

もし「覚えた問題」だけでテストしたら、 本当に理解しているのか、 ただ暗記しているだけなのかが分かりません。

そのため、 学習用のデータ評価用のデータを分けます。

学習データとは何か

学習データ(Training Data)とは、 モデルに知識を覚えさせるためのデータです。

教師あり学習の場合、 次のような形になっています。

  • 入力データ(特徴量)
  • 正解データ(ラベル)

例:迷惑メール判定

  • メール本文 → 入力データ
  • 迷惑/通常 → 正解ラベル

モデルは、 このデータを使って 「どういう特徴が迷惑メールか」 を学びます。

テストデータとは何か

テストデータ(Test Data)とは、 学習が終わったモデルを評価するためのデータです。

重要なのは、 学習では一切使っていないデータ であることです。

これにより、 「初めて見るデータに対しても正しく判断できるか」 を確認できます。

学習データとテストデータの役割の違い

項目学習データテストデータ
目的モデルを賢くするモデルを評価する
使用タイミング学習時学習後
正解ラベル使う評価のために使う
AI-900重要度非常に高

分けないと何が問題なのか

学習データだけで評価すると、 次のような問題が起きます。

  • 精度が異常に高く見える
  • 実際の業務で使えない
  • 試験では誤りとして扱われる

これは 過学習(オーバーフィッティング) と呼ばれる状態です。

AI-900での出題ポイント

AI-900では、 次のような形で問われます。

  • モデル評価に使うのはどのデータか
  • 精度測定に学習データを使うのは正しいか
  • 新しいデータへの汎化性能とは何か

答えとして重要なのは、 「テストデータで評価する」 という点です。

イメージで理解する(試験向け)

学校のテストに例えると分かりやすいです。

  • 教科書・問題集 → 学習データ
  • 本番試験 → テストデータ

問題集の答えを覚えても、 本番で解けなければ意味がありません。

まとめ

  • 学習データはモデルを作るためのデータ
  • テストデータはモデルを評価するためのデータ
  • 評価には必ず学習に使っていないデータを使う
  • AI-900では頻出の超重要概念

この違いを正しく説明できれば、 AI-900の機械学習分野でつまずくことはありません。

AI-900を体系的に学びたい方へ
この記事は「AI-900試験対策」シリーズの一部です。
▼AI-900完全ロードマップはこちら

AI-900準拠!Azure AI演習 Vol.1【全10問】

最新の試験範囲からランダムで10問を出題。
本番レベルの問題で、現在の理解度を5分でチェック!
全問正解して合格への自信を掴みましょう。

1 / 10

AIが特定のグループを不当に優遇・冷遇せず、すべての人に平等に接することを目指す原則は?

2 / 10

責任あるAIの「透明性」において、AIが生成した画像であることを示すために埋め込まれる情報は?

3 / 10

Azure Machine Learningで、GUI(ドラッグ&ドロップ)でモデルを作成できるツールは?

4 / 10

AIシステムが社会に与える影響に対し、開発者や運営者が責任を持つべきとする原則は?

5 / 10

生成AIが、学習データにない「事実に基づかない情報」を生成してしまう現象を何と呼ぶか?

6 / 10

生成AIが、前の会話の内容を覚えていて「それについて詳しく教えて」という指示に対応できる性質は?

7 / 10

Azure Machine Learningで、モデルの性能を「平均二乗誤差(MSE)」などで評価する手法はどれか?

8 / 10

Azure Machine Learningで、モデルのトレーニングに使用される計算用マシンの集まりを何と呼ぶか?

9 / 10

Azure AI Languageで、テキストから人名や地名などの固有名詞を見つける機能は?

10 / 10

GPTなどのように、膨大なデータで学習され、多目的に利用できる大規模なAIモデルを何と呼ぶか?

あなたのスコアは

平均スコアは 81%

0%

目次