如需评估测量中的误差范围,您可使用基本的统计学方法计算标准偏差,正如我们在这里已讨论过的那样。但即使是对于整个群体中的一个样本,其估计的标准偏差仍然需要相对大量的测量。在光谱学中,我们通常对一个样本进行几次测量,可能是5到10次。在该抽样准则中,使用正态分布标准偏差的基本表达式无法得出测量误差的可靠值。幸运的是,20世纪初在啤酒生产方面所做的工作给了我们一个解决方案。
William Sealy Gosset, Wikipedia.org
William Sealy Gosset和健力士
William Sealy Gosset是一名统计学家,其在都柏林的健力士啤酒厂担任首席啤酒酿造师。他关心的是从各种大麦(啤酒的重要原料)中获得最佳产量。当他不得不从少到三粒大麦中得出有意义的统计学结论时,他在工作中遇到小样本量问题。
在1908年发表的论文《平均数的概率误差》中,他这样描述了这个问题:
“随着实验次数的减少,从实验样本中发现的标准偏差的值本身会受到越来越大的误差影响,直到以这种方式得出的判断可能会完全产生误导。”
Gosset开发了后来被称为“学生t-分布函数”的方法(之所以这样命名,是因为他以笔名“学生”发表了这篇论文),并且公布了可用于极小样本量的数值表。该分布比正态分布更宽、更短,并允许更多的偏离测量值。随着测量次数的增加,分布情况趋向于呈现经典的正态分布曲线。
t-分布函数
t-分布函数给出的置信区间表达式为:
uc=x̅+/-Tx
式中:
x̅:测量值的平均值
TX:t-分布函数的值。根据以下公式计算:
Tx=(t(f,P)x s/N1/2
式中:
t:取自公布表格的值,该值取决于f(测量的样本数-1)和P(期望的置信度)。
s:测量系列的标准偏差
N:采用的测量次数
在光谱学中使用t-分布函数
让我们以一个组件中铬的真实成分结果为例,描述使用t-分布函数计算置信区间的过程。
10次读数的平均值:18.54%
标准差:0.1%。
我们将选择95%置信度,因此必须使用的数字是:
N:10(10次读数)
s:0.1%(标准偏差取自上表)
t:2.262(针对置信区间为95%和样本量为10,取自公布的表格,f=n-1)
因此:
Tx=(2·262 × 0·1%)/3·162=0·072%
我们可用其作为我们的置信区间:
uc=x+/- Tx
x:18.54(测量结果的平均值,取自上表)
uc(95.9)=18.54%+/- 0.07%
这表明我们有约95%的置信度,认为铬的真实值介于18.47%到18.61%之间。
有趣的是,t-分布函数给出一个小于标准偏差的置信区间,这意味着我们的光谱学测量实际上比标准统计学方法所显示的结果更精确。
当然,如需使用这种方法,您必须在光谱仪中读取单个样本的多个读数。
想了解更多?
我们将在《指南:寻找真值》中讨论如何准确计算光谱学测量的置信区间。在本文中,我们通过实际光谱学测量的示例,向您阐明在您没有估计测量结果真实误差所需的所有信息的情况下应采取的举措。请在这里下载您的副本。