one-hot 编码
在深度学习中,经常会听到 one-hot 编码,也称“独热编码”。
什么是 one-hot 编码?
one-hot 编码用于将离散的分类标签转换为二进制向量。
什么是离散的分类?
假设我们要做一个分类任务,总共有 3 个类别,分别是猫、狗、人。
那这三个类别就是一种离散的分类:它们之间互相独立,不存在谁比谁大、谁比谁先、谁比谁后的关系。
二进制向量
独热编码怎么做?
假设我们有 3 个类别,分别是猫、狗、人。
我们可以用一个 3 维的向量来表示这 3 个类别,其中只有一个维度的值为 1,其他维度的值为 0。
[猫]:[1, 0, 0]
[狗]:[0, 1, 0]
[人]:[0, 0, 1]
这样,我们就将离散的分类标签转换为了二进制向量。
我们学过几何,在三维坐标系下,[1, 0, 0]、[0, 1, 0]和[0, 0, 1]这三个向量是互相垂直的,也就是互相正交独立。
独立编码怎么用
Last updated