标准化数据应在补充缺失值之前还是之后?

2023-06-21 13:40:13  来源:哔哩哔哩


(资料图片仅供参考)

标准化数据(将数据调整为统一规模,使其具有 0 均值和 1 标准差)的过程通常应该在补充缺失值之后进行。原因如下:

如果先进行标准化,我们需要知道数据集的均值和标准差,然后使用这些统计量进行缩放。但是,缺失值可能会导致计算的均值和标准差出现偏差。

补充缺失值通常需要对数据进行一定程度的预处理,例如使用均值、中位数、众数等插值方法。在补充缺失值后再进行标准化可以确保所有数据点都遵循相同的缩放规则。

所以,一般建议在补充缺失值之后对数据进行标准化。但请注意,这种顺序可能根据特定场景中的数据质量、缺失值比例和数据预处理策略而有所不同。