Articles

フレーミング:キー ML用語集

(教師あり)機械学習とは何ですか? 簡潔に言えば、それは次のとおりです。

  • MLシステムは、これまでに見たことのないデータで有用な予測を生成するために入力を結合する方法を学

基本的な機械学習の用語を見てみましょう。

ラベル

ラベルは私たちが予測しているものです—y変数単純な線形回帰。 ラベルは、小麦の将来の価格、画像に示されている動物の種類、オーディオクリップの意味、またはちょうど何かである可能性があります。

Features

featureは入力変数です—単純なlinearregressionのx変数。 単純な機械学習プロジェクトではsinglefeatureを使用する場合がありますが、より洗練された機械学習プロジェクトでは、次のように指定された何百万もの機:

  • 電子メールのテキスト内の単語
  • 送信者のアドレス
  • 電子メールが送信された時刻
  • 電子メールには、”一つの奇妙なトリック。”

Examples

例は、データの特定のインスタンスxです。(xがベクトルであることを示すために、xを太字で入力します。

  • ラベル付きの例
  • ラベル付きの例

ラベル付きの例には、特徴とラベルの両方が含まれます。 それは次のとおりです。

 labeled examples: {features, label}: (x, y)

モデルを訓練するためにラベル付きの例を使用します。 スパム検出の例では、ラベル付きの例は、ユーザーが明示的に”スパム”または”スパムではない”とマークした個々の電子メールです。”

たとえば、次の表は、カリフォルニア州の住宅価格に関する情報を含むデータセットから5つのラベル付きの例を示しています:

housingMedianAge
(feature)
totalRooms
(feature)
totalBedrooms
(feature)
medianHouseValue
(label)
15 5612 1283 66900
19 7650 1901 80100
17 720 174 85700
14 1501 337 73400
20 1454 326 65500

An unlabeled example contains features but not the ラベル。 つまり、

 unlabeled examples: {features, ?}: (x, ?)

同じハウジングデータセットから3つのラベルのない例があります。medianHouseValue:

housingMedianAge
(feature)
totalRooms
(feature)
totalRooms
(feature)
totalRooms
(feature)
totalRooms
(feature)
totalRooms
(feature)
totalrooms
(feature)
totalrooms
(feature)

ラベル付けされた例でモデルを訓練したら、そのモデルを使用してラベルのない例のラベルをpredictします。 スパム検出器では、unlabeledexamplesは、人間がまだラベル付けしていない新しい電子メールです。

モデル

モデルは、フィーチャとラベルの関係を定義します。たとえば、スパム検出モデルは、特定の機能を強く”スパム”に関連付けることができます。 モデルの寿命の2つの段階を強調してみましょう:

  • トレーニングとは、モデルを作成または学習することを意味します。 つまり、モデルのラベル付きの例を表示し、モデルがフィーチャとラベルの関係を徐々に学習できるようにします。

  • 推論とは、学習したモデルをラベルのない例に適用することを意味します。つまり、訓練されたモデルを使用して有用な予測を行います(y'medianHouseValueを予測できます。

回帰と分類

回帰モデルは連続値を予測します。 たとえば、regressionmodelsは次のような質問に答える予測を行います。

  • カリフォルニアの家の価値は何ですか?ユーザーがこの広告をクリックする確率はどれくらいですか?

  • ユーザーがこの広告をクリックする確率はどれくらいですか?

分類モデルは離散値を予測します。 たとえば、分類モデルは、次のような質問に答える予測を行います。

  • 与えられた電子メールメッセージスパムかスパムではありませんか?これは犬、猫、またはハムスターのイメージですか?

  • これは犬、猫、またはハムスターのイメージですか?

コメントを残す

メールアドレスが公開されることはありません。