误差问题

先谈谈误差,什么是误差?误差(errors)是一个实验科学术语,指测量结果偏离真值的程度。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即使使用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。数值计算分为绝对误差相对误差。也可以根据误差来源分为系统误差(又称可定误差、已定误差)、随机误差(又称机会误差、未定误差)和毛误差(又称粗差)。


绝对误差与相对误差

绝对误差(Absolute error)= 测量值 - 真值

相对误差(Relative error) = 绝对误差/真值

一般来说,相对误差比绝对误差更能反映测量的可信程度,比如用同一把尺子测量长度为1厘米和10厘米的物体,他们的测量值的绝对误差显然是接近的,但是相对误差前者比后者大了一个数量级,表明后者测量值更为可信。


根据误差的来源又可以分为系统误差(又称可定误差)、随机误差(又称未定误差)和毛误差(又称过失误差)。

系统误差(System error)分为固定误差比例误差,原因可能有仪器本身误差(instrumental errors)、采用方法的误差(method errors)、个人误差(personal errors)、环境误差(Environmental error)。理论上系统误差可以通过一定的手段(如:校正)来消除。举例而言,天平的两臂应是等长的,可实际上是不可能完全相等的;天平配置的相同质量的砝码应是一样的,可实际上它们不可能达到一样。

随机误差(Random error),无法控制的变因,会使得测量值产生随机分布的误差。它服从统计学上所谓的“正态分布”或称“高斯分布”,它是不可消除的,在这个意义上,测量对象的真值是永远不可知的,只能通过多次测量获得的均值尽量逼近。系统误差以相同的方式影响所有测量值,将它们推向同一个方向;随机误差,则随着不同次的测量而变化,有时候向上或向下。

毛误差(Gross error),毛误差主要是由于测量者的疏忽犯下不应有的错误造成的。例如读数错误、记录错误、测量时发生未察觉的异常情况等等,这种误差是可以避免的(如:舍弃有关数据重新测量)。

系统误差中的个人误差(personal errors)与毛误差(Gross error)的差别

个人误差又称人员误差,是由于测定人员的分辨力、反应速度的差异和固有习惯引起的误差。这类误差往往因人而异,因而可以采取让不同人员进行分析,以平均值报告分析结果的方法予以限制。毛误差主要是由于测量者的疏忽所造成的。


系统误差(systematic errors)与随机误差(random errors)的区别:

系统误差是由系统本身的问题决定的,比如仪器本身误差(天平两臂不等长)、个人误差等,系统误差永远往一个方向偏差,样本量再大(甚至测总体)都解决不了。而随机误差无规律,会影响到测量的reliability(理解为效度),可以通过加大样本量来减小随机误差,比如当样本与总体一样时,随机误差就为零,也就是所有随机误差互相抵消。

下图为陈浩老师授课ppt中的一张,可能更便于理解:

errors

如上图,左边打靶reliability和validity都低,随机误差很高(从图中可以看出外圈很分散,像随机打的一样),系统误差较低(没有偏向一个方向)

中间打靶偏向于一个方向,系统误差较高,随机误差较低,reliability较高,validity较低。

右边打靶基本都打在靶心附近,reliability和validity都很高,系统误差和随机误差都很低

我们追求的目标就是同时保持随机误差和系统误差都尽可能低,也就是上例中最好都打在靶心。