从标准差到变异系数 · 全面解读离散指数计算方法与应用
离散指数(Dispersion Index)是统计学中衡量数据分布离散程度或变异性的指标集合。它告诉我们数据值是紧密聚集还是分散分布。常用的离散指数包括极差、方差、标准差、四分位距、变异系数等。其中标准差与方差最为核心,而变异系数则用于比较不同量纲数据的离散程度。
简单来说,离散指数越大,数据越分散;离散指数越小,数据越集中。在金融、质量控制、社会科学等领域都有广泛应用。
最常用的离散指数,反映数据点与均值的平均距离。
总体标准差
σ = √[ Σ(xᵢ - μ)² / N ]
样本标准差
s = √[ Σ(xᵢ - x̄)² / (n-1) ]
标准差的平方,突出离群值的影响。
总体方差
σ² = Σ(xᵢ - μ)² / N
样本方差
s² = Σ(xᵢ - x̄)² / (n-1)
消除量纲影响的相对离散指数。
CV = (σ / μ) × 100%
适用于均值非零且比较不同单位数据的离散程度。
极差 = 最大值 - 最小值;四分位距 (IQR) = Q3 - Q1。
Range = Max - Min
IQR = Q₃ - Q₁
IQR 对异常值更稳健。
数据集: 78, 85, 92, 88, 76, 95, 89 (7个样本)
👉 离散指数越小(CV≈8.2%),说明该组学生成绩较集中,差异不大。
💡 选择建议
当数据量纲一致且均值接近时,使用标准差;比较不同量纲或均值差异大的数据集,优先用变异系数;若数据含异常值,四分位距更稳健。
68-95-99.7 法则依赖标准差
比较股票与债券波动
识别异常值的有力工具