Content Cell | Content Cell | Content Cell |
Content Cell | Content Cell | Content Cell |
001 | cpu1 | master |
002 | cpu2 | slave |
Z-Score | \(x^' = (x-mean)/std\) | 默认标准化方法,生成数据以0为均值,方差为1的正态分布。 | 一种中心化方法,会改变原有数据的分布结构,不适合用于对稀疏数据做处理。 | [0,1] |
Max-Min | \(x^'=(x-min)/(max-min)\) | 应用广泛,对数据线性变换,能较好地保持原有数据结构。 | 可能出现分母为0,导致计算溢出。 | [0,1] |
MaxAbs | \(x^'=x/|max|\) | 不破坏原有数据分布结构,可以用于稀疏数据、稀疏的CSR或CSC | - | [-1, 1] |
RobustScaler | - | 针对离群点做标准化处理,对数据中心华和数据的缩放健壮性有更强的参数控制能力。能最大限度地保留数据集中的异常。 | - | - |
First Header | Second Header | Third Header ---------------- | --------------------- | ----------------Content Cell | Content Cell | Content Cell Content Cell | Content Cell | Content Cell 标题一 | 标题二 | 标题三 -----------------|-----------------------|-------------------001 | cpu1 | master 002 | cpu2 | slave 标准化方法|数学公式|优点|缺点|区间--------|--------|---------|---------|---------Z-Score|$x^' = (x-mean)/std$|默认标准化方法,生成数据以0为均值,方差为1的正态分布。|一种中心化方法,会改变原有数据的分布结构,不适合用于对稀疏数据做处理。|[0,1]Max-Min|$x^'=(x-min)/(max-min)$|应用广泛,对数据线性变换,能较好地保持原有数据结构。|可能出现分母为0,导致计算溢出。|[0,1]MaxAbs|$x^'=x/|max|$|不破坏原有数据分布结构,可以用于稀疏数据、稀疏的CSR或CSC|\-|[-1, 1]RobustScaler|\-|针对离群点做标准化处理,对数据中心华和数据的缩放健壮性有更强的参数控制能力。能最大限度地保留数据集中的异常。|\-|\-