one-hot 编码

在深度学习中,经常会听到 one-hot 编码,也称“独热编码”。

什么是 one-hot 编码?

one-hot 编码用于将离散的分类标签转换为二进制向量。

  1. 什么是离散的分类?

假设我们要做一个分类任务,总共有 3 个类别,分别是猫、狗、人。

那这三个类别就是一种离散的分类:它们之间互相独立,不存在谁比谁大、谁比谁先、谁比谁后的关系。

  1. 二进制向量

独热编码怎么做?

假设我们有 3 个类别,分别是猫、狗、人。

我们可以用一个 3 维的向量来表示这 3 个类别,其中只有一个维度的值为 1,其他维度的值为 0。

[猫]:[1, 0, 0]

[狗]:[0, 1, 0]

[人]:[0, 0, 1]

这样,我们就将离散的分类标签转换为了二进制向量。

我们学过几何,在三维坐标系下,[1, 0, 0]、[0, 1, 0]和[0, 0, 1]这三个向量是互相垂直的,也就是互相正交独立。

独立编码怎么用

Last updated