用Origin剔除线性拟合中实验数据的异常值

来源:互联网 时间:2016-01-03

介绍了用Microcal Origin 软件进行实验数据线性拟合的具体方法,利用其Lab Talk 编程和Data Mask 等高级功能,以肖维勒准则实现了异常数据的判断和剔除.

1、用Origin 实现实验数据的线性拟合

下面以近代物理实验中的核磁共振的稳态吸收实验为例,说明Origin 用于实验数据线性拟合及分析的方法和步骤.

1.1、数据输入

首先将实验数据输入到Origin 的工作表Worksheet 中. 按其默认设置打开一工作表窗口,在本文的实验中共有13 组电磁铁的励磁电流I 、磁场强度B 的值,置于图1 中工作表I (A) 、B (T) 两列.

1.2、调用绘图窗口

点击Plot 菜单的Scatter 项,将弹出绘图坐标轴选项. 设置好x 、y 轴后,出现绘图Graph 窗口下的数据点状分布图.

1.3、原始数据的线性拟合

本实验要求BI 关系为线性拟合. 点击分析菜单Analysis ,选择线性拟合Filt Liner. 此时Origin 自动调用内置的最小二乘法线性拟合工具. 图中新增一条拟合出来的直线,同时弹出结果窗口Result Log ,显示拟合结果,包括线性回归方程系数A、B、标准差SD、相关系数R 等参数. 如图1 所示,在本例中,A = 0. 4227 ,B = 0. 08283 ,SD = 0. 00426.至此为止,完成了数据输入、线性拟合和图示化表征. 从以上步骤可看出,Origin 在数据的线性拟合中具有直观、方便、快捷的优点.

图1 原始数据线性拟合结果

2、异常值的判断和剔除

由图1 可看出,测量数据中第6、7 点离拟合直线偏差较大,是可疑数据点. 下面判断可疑数据点是否为异常值并进行剔除.

2. 1、计算残差

调出数据的工作表窗口Datal ,通过Column/ Add New Column 新增一列,命名为Vd ,存放残差. 点击Window/ Script Window 调出Lab Talk 程序窗口. Lab Talk 编程类似C 语言,但命令更直观. 在其窗口菜单Edit 下选择Script Execution 模式,只有在此模式下,才能执行程序. 根据以上拟合得到的A、B 值,输入如下命令,对数据集直接运算:Datal Vd = 0. 4227 + Datal 130. 08283 —Datal B ;得到Vd 列的值.

2. 2 、查表比较

查肖维勒准则表可得,当n 为13 时,ω13为2. 07. 用Column/ Add New Column 新增一列,命名为Contrast ,该列为| Vd| 与ωn·σ的对比结果即|Vd| - ωn·σ. 在Lab Talk 程序窗口输入:Datal Contrast = abs (Datal Vd) - 2. 0730. 00426 ;得到对比Contrast 列的值,其中abs (x) 为取绝对值函数. 在Contrast 列中,只有第7 点为正值,即| Vd7| >ω13·σ,所以第7 点为粗差,应剔除.

2. 3 、异常值剔除

鼠标右键单击工作表中第7 点数据,选Mask/ Apply ,则此行所有数据变为红色,被屏蔽.

2. 4 、异常值剔除后的拟合

对剩下的12 个点重新拟合,得到异常值剔除后的A、B、SD、R 值,拟合曲线如图2 所示. 此时第6 点偏差最大,但由于实验数据的异常值通常只剔除一次,即使第一次异常值剔除后还存在偏差较大的点,也不再进行第二次判断和剔除.

图2 异常值剔除后的拟合情况

2. 5 、剔除异常值前后的参数比较

表1 剔除异常值前后的参数比较

由表1 看出,剔除异常值后,R 值明显增大,拟合效果显著提高,输出的拟合线相对理想. 因此,利用Origin 软件对异常值的判断和剔除相当方便,异常值剔除后可以明显提高拟合效果,更准确地求出曲线斜率. 另外,教师也可针对不同学生的R 值进行比较,从中了解学生的实验情况,并有针对性地要求学生查找原因、分析影响实验的因素

相关阅读:
Top