谷歌机器学习课程笔记(2)——基本概念

本课程将介绍的基本框架:监督式机器学习。即机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。

 

基本术语:

 

标签是我们要预测的事物,即简单线性回归中的 y 变量。

 

特征是输入变量,即简单线性回归中的 x 变量。简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征,按如下方式指定:{x1,x2,...xN}

 

样本是指数据的特定实例。我们将样本分为以下两类:

有标签样本同时包含特征和标签

我们使用有标签样本来训练模型。

无标签样本包含特征,但不包含标签。

在使用有标签样本训练了我们的模型之后,我们会使用该模型来预测无标签样本的标签。

 

模型定义了特征与标签之间的关系。

模型生命周期的两个阶段:

训练表示创建或学习模型。

推断表示将训练后的模型应用于无标签样本。

 

模型有两大类:

回归模型可预测连续值。

分类模型可预测离散值。

Pingbacks已关闭。

Trackbacks

评论已关闭