
2.3 实验数据的误差分析
化工实验测量获得的数据是实验的初步结果,由于测量仪器和工程设备等客观因素和实验人员等主观原因,实验数据在客观上存在误差,并且具有普遍性。因此,化工实验要研究误差的来源和规律性,尽可能减小误差,得到比较准确的实验结果,为解决工程问题提供依据。实验数据的统计处理需要学习概率论和统计学的相关知识,本章仅从应用的角度,简要介绍实验误差的基本概念和计算方法。
2.3.1 真值和平均值
真值是在某一时刻和某一状态下,某物理量的客观值或实际值。一般来说,真值是未知的,通常还无法测量;相对来说,真值又是已知的,如理论真值:平面三角形三内角之和为180°,国家标准样品的标称值;相对真值:国际上公认的计量值,高精度仪器所测之值;近似真值;多次试验值的平均值等。
平均值是根据有限次实验结果计算得到的值,只能近似等于真值,或者叫真值的近似值。平均值种类很多,实验中常见的有5种:算术平均值、加权平均值、对数平均值、几何平均值和均方根平均值等。不同平均值都有各自的适用条件,主要取决于实验数据本身的特点。
①算术平均值,用表示,xi表示单个实验值。
(2-1)
②加权平均值,用表示,wi表示权重,适用于不同试验值的精度或可靠性不一致的情况。
(2-2)
③对数平均值,用表示,设两个数:x1>0,x2>0,则:
(2-3)
若实验数据的分布具有对数特性,则宜使用对数平均值。对数平均值
≤算术平均值
;如果1/2≤x1/x2≤2时,可用算术平均值
代替对数平均值
,相对误差≤4.4%。
④几何平均值,用表示。当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。几何平均值=算术平均值。
(2-4)
⑤均方根平均值,用表示。
(2-5)
2.3.2 最可信赖值的计算
在具有等精度的测量值中,最可信赖值是指能使各测量值的误差的平方和为最小时所表示的那个值。对未知量x进行n次重复测量,得到一组等精度的测量结果x1,x2,…,xi,…,xn,应用最小二乘法原理,可以确定未知量x的最可信赖值。
由于真值xt未知,所以用一组测量值的最可信赖值a代替。对应的残差Δ为
Δ1=x1-a,Δ2=x2-a,…,Δn=xn-a
依据高斯定律,具有误差为Δ1,Δ2,…,Δn的观测值出现的概率分别为
因各次测量值是独立事件,所以误差Δ1,Δ2,…,Δn同时出现的概率为各个概率的乘积。即:
由于可信赖值是概率P最大时所求的那个值,从指数关系可知,当P最大时,(x1-a)2+(x2-a)2+…+(xn-a)2应为最小,即在一组测量中各误差的平方和最小。
设:Q=(x1-a)2+(x2-a)2+…+(xn-a)2
Q最小的条件为:
对上式进行微分,并取为零,则得:-2(x1-a)-2(x2-a)-…-2(xn-a)=0
na=x1+x2+…+xn
即 (2-6)
上述分析表明:在等精度(相同)的条件下,最可信赖值就是n次测量值的算术平均值x,此时各测量值与算术平均值的偏差的平方和为最小。
2.3.3 绝对误差和相对误差
(1)绝对误差
绝对误差=实验值-真值 (2-7)
绝对误差Δx反映了实验值偏离真值的大小,这个偏差可正可负。通常实验测量所说的误差一般指绝对误差。
Δx=x-xt (2-8)
所以有
xt=x±|Δx| (2-9)
测量中通常取仪器的最小刻度值作为最大绝对误差,而取其最小刻度的1/2作为绝对误差的计算值。化工实验中,如果对某量只进行一次测量,一般可将测量仪器上标注的精度等级或仪器的最小刻度,作为单次测量误差的计算依据。
例2-3 某压力表标注精度为1.5级,最大量程为0.8MPa,求该压力表的最大绝对误差。
解 精度为1.5级,表明该压力表的绝对误差为最大量程的1.5%,则该压力表的最大绝对误差Δx为:0.8×1.5%=0.012MPa。
(2)相对误差
(2-10)
如果用ER表示相对误差,则有
(2-11)
或者
(2-12)
显然,相对误差|ER|小,实验值的精度较高。
例2-4 某样品的质量称量结果为58.7g±0.2g,求其相对误差。
解 或0.3%
(3)绝对误差和相对误差的关系
n次测量值的算术平均值x的绝对误差如下:
(2-13)
绝对误差Δx的大小与标准偏差σ成正比,与测量次数n的平方根成反比,即:标准误差σ越小,测量次数n越多,绝对误差Δx越小。
算术平均值x的相对误差为
(2-14)
以算术平均值作为测量结果的最可信赖值,可以通过增加测量次数来减小随机误差。
2.3.4 标准偏差和相对标准偏差
(1)标准偏差
标准偏差σ也称作均方根误差、标准误差,或简称为标准差。当实验次数n无穷大时,称为总体的标准差,其定义为
(2-15)
实际工作中,实验次数一般为有限次,于是又有样本标准差s,其定义为
(2-16)
标准差s不但与一组实验值中的每一个数据有关,而且对其中较大或较小的误差敏感性很强,能明显地反映出较大的个别误差。它常用来表示实验值的精密度,标准差越小,则实验数据精密度越好。
(2)相对标准偏差
相对标准偏差RSD,也叫变异系数CV,定义是标准偏差除以算术平均值,它反映了实验数据的离散程度。计算式如下,
(2-17)
例2-5 某实验得到下列两组数据,计算标准偏差和相对标准偏差,分析两组数据的精密度。
A:2.2,2.3,2.4,2.5,2.6
B:2.1,2.4,2.7,2.4,2.7
解 根据式(2-1),A组和B组的算术平均值为;
根据式(2-16),A组和B组的标准误差为SA=0.16,SB=0.25;
根据式(2-17),A组和B组的相对标准误差为RSDA=6.73%,RSDB=10.46%。
分析:A组和B组的算术平均值相差不多,但是标准偏差和相对标准偏差相差较大,反映出2组数据的离散程度不同,对比B组的结果,A组的精密度较好。
2.3.5 随机误差、系统误差和过失误差
(1)随机误差
随机误差是指在一定实验条件下,以不可预知的规律变化着的误差,可以用绝对误差描述。它符合统计规律:多次测量值的绝对误差时正时负,其绝对值或大或小;大多服从正态分布,即绝对值小的误差比绝对值大的误差出现的机会多,而且绝对值相等的正、负误差出现的次数近似相等。因此当实验次数足够多时,由于正、负误差相互抵消,绝对误差的平均值趋向于零。因为算术平均值的随机误差比单个实验值的随机误差小,因此可以通过增加实验次数的方法减小随机误差。
实验中的随机误差一般是无法避免的,因为它是实验过程中一系列偶然因素造成的,例如温度的微小变动、仪器的轻微振动、电压的微小波动等,而这些偶然因素是实验者无法严格控制的。
(2)系统误差
系统误差是指在一定实验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差。它的规律是:一旦实验条件确定,系统误差就是一个客观上的恒定值,其大小和正负符号是恒定的,它不能通过多次实验发现,也不能通过增加实验次数而减小。
实验中的系统误差可以校正或消除,前提是充分认识系统误差产生的原因。产生系统误差的原因是多方面的,可能来自仪器的刻度不均匀,可能来自实验者的操作不当,也可来自实验方法本身的不完善等。
(3)过失误差
过失误差是一种明显与事实不符的误差。它没有规律,主要是由于实验人员主观上粗心大意造成,比如读数错误、记录错误或操作失误等。
过失误差是可以完全避免的,前提是实验者态度端正、责任心强。