统计学如何判断实验的可重复性
标准偏差是什么意思?
标准偏差是什么意思?
标准差(外文名:Standard Deviation,又称:均方差)是离均差平方的算术平均数的平方根,用σ表示,标准差是方差的算术平方根。 标准差在概率统计中最常使用作为统计分布程度,还能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
标准差(StandardDeviation),在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。测量到分布程度的结果,原则上具有两种性质:
为非负数值,与测量资料具有相同单位。一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间,有所差别。
简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,两组数的集合{0,5,9,14}和{5,6,8,9}其平均值都是7,但第二个集合具有较小的标准差。
标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。
标准差应用于投资上,可作为量度回报稳定性的指标。标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。相反,标准差数值越小,代表回报较为稳定,风险亦较小。
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差约为17.08分,B组的标准差约为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。
如是总体(即估算总体方差),根号内除以n(对应excel函数:STDEVP);
如是抽样(即估算样本方差),根号内除以(n-1)(对应excel函数:STDEV);
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)。
一个良好的分析方法应该具备的特征?
1、直观性
现实世界是复杂多样的,其本质和规律难以直接把握,统计分析方法从现实情境中收集数据,通过次序、频数等直观、浅显的量化数字及简明的图表表现出来,这些数据的处理,将我们的调研与客观世界紧密相连,从而提示和洞悉现实世界的本质及其规律。
2、可重复性
可重复性是衡量研究质量与水平高低的一个客观尺度,用统计分析方法进行的研究皆是可重复的。从课题的选取、抽样的设计,到数据的收集与处理,皆可在相同的条件下进行重复,并能对研究所得的结果进行验证。
3、科学性
统计分析方法以数学为基础,具有严密的结构,需要遵循特定的程序和规范,从确立选题、提出假设、进行抽样、具体实施,一直到分析解释数据,得出结论,都须符合一定的逻辑和标准。