O
June 03, 2023
本文旨在按字母顺序对团队研究过程中涉及的术语进行分类解释,为对该领域感兴趣的读者提供一份全面的术语表。
Object Recognition
物体识别
One-hot Encoding
独热编码(One-hot encoding)是将分类值转换为二进制值的表示方法,用于在应用机器学习算法时对分类数据进行处理。例如,假设有三个分类数据:“中国”、“新加坡”、“美国”,可以简单地使用整数编码将其转换为“中国”=1,“新加坡”=2,“美国”=3。 但是,使用独热编码时,“中国”=[1 0 0],“新加坡”=[0 1 0],“美国”=[0 0 1],以二进制形式表示。整数编码的简单问题在于,机器学习算法可能会从整数值中学习到错误的趋势。例如,在上述例子中,如果使用整数编码, 机器学习算法可能会学习到“中国”(=1)和“新加坡”(=3)的平均值(1+3/2=2)等于“美国”(=2),这显然是错误的学习。
Optimization
在深度学习模型的训练中,优化(Optimization)通常指的是对参数进行优化的过程。寻找最优值的过程类似于从山顶下降时寻找捷径以快速下山的过程。首先,假设山是损失函数(loss function)或者成本函数(cost function)。 在能够从山顶下降的多条路径中,找到捷径相当于正确设置步长的方向,而快速下山则类似于步长大小(step size)或学习率(learning rate)。为了进行适当的优化,步长和方向这两个因素都必须满足。
Optimizer
优化器(Optimizer)是指用于优化的算法或技术。这些优化器可以根据步长的方向和步长大小(即学习率)进行分类。
Ordinary Least Squares(OLS)
OLS (普通最小二乘法) 或 LLS (线性最小二乘法) 是线性回归中寻找解的方法之一。它通过矩阵求导来最小化平方误差和(残差平方和)以获得权重向量。
Overfitting
当模型的复杂度相对于训练数据来说过高时,模型在学习过程中权重的值会逐渐增大,模型会对训练数据过度敏感,最终导致过拟合现象的发生。换句话说,模型会受到局部噪声的影响,适应了异常值。过拟合是指在训练过程中,机器学习算法过于优化于训练数据,因此对于之前未见过的新数据(测试数据)表现不佳。 换句话说,模型的泛化能力下降。这通常是由于机器学习算法的表达能力过强导致的现象。另一个说法是高方差-低偏差。为了防止过拟合,可以使用正则化等技术。
出现过度拟合的情况(最右侧图示)