由于三段气流干燥过程的复杂性和不确定性,很难通过机理分析建立机理模型。用传统的最小二乘法建立的多元线性回归模型在自变量之间相关程度高,观测值矩阵出现严重的多重共线时,会使回归系数的均方误差偏大,从而影响模型拟合的优度[6].本文采用主元分析的方法,对相关的过程变量进行降维处理,挑选出能最大程度的反映原来多个变量信息的过程变量。为了提高模型的精度,采用改进的BP神经网络对模型进行修正。
主元回归建模主元分析主元分析是输入数据降维处理的主要方法之一,又称为主成分分析或主元素分析,是多元统计过程控制(MSPC)方法最重要的数学工具。主元分析利用变量之间的线性相关关系对多维信息进行统计压缩,用少部分互不相关的主元变量描述多维空间的绝大部分的动态信息,以减轻数据分析的复杂度。
假设数据矩阵[X]pn,p代表测量采样次数,n代表测量变量个数。主元分析法的基本思想为(1)将原始数据进行标准化处理。
xij=xij-MjSjj(1)式中,xij(i=0,1,,n;j=0,1,,m)为经过自标准化的第i个样本的第j个变量;xij为原始变量;Mj,Sj分别是第j个变量的算术平均值和标准偏差。
(2)计算其协方差矩阵R.R=[rij]nn(2)式中,rij=1Ppk=1xkixkj(i,j=1,2,,n)。
(3)计算R的特征值,特征向量。利用雅可比法求矩阵R的n个非负的特征值12n0,以及对应的特征向量:C(i)=[c1(i)c2(i)cn(i)]T(4)选择主元。
由特征向量组成n个新变量:z1=c1(1)x1 c2(1)x2 cn(1)xnz2=c1(2)x1 c2(2)x2 cn(2)xnMzn=c1(n)x1 c2(n)x2 cn(n)xn当前面m个变量z1,z2,,zm(m
建立主元回归模型回归分析是处理变量间相关关系的有力工具,它不仅告诉人们怎样建立变量间的数学表达式,而且还利用概率统计知识进行分析讨论,判断出所建立的经验公式的有效性,从而可以进行预测和估计[7].因此,在生产实际中得到广泛的应用。
根据现场工艺调查和对机理的定性分析,并考虑到变量的类型、数目和测点位置,得到影响气流干燥过程精矿含水率的因素有以下11个:精矿量、湿矿含水率、烟气量、烟气温度、燃油量、鼓风量(是燃烧风、稀释风和氮气的总和)、热风温度、机内负压、混气室出口温度、回转窑尾温度及沉尘室温度。对从现场采集的历史数据进行挑选并对它们进行统计分析、数据滤波、3法则、目标范围标准化和主元分析的处理后得到210组数据,其主元贡献率如所以。
从表中可以看出,前6个主成分的贡献率达到了91,也就是说前6个主成分可以描述91的原数据信息,因此我们选取前6个变量建立回归模型。取150组数据作为训练样本,得到如下的主元回归模型:y=-0304x1 14722x2 04551x3 03774x4-03445x5 00365x6-08607(3)利用另外60组数据进行仿真分析,其预测结果如所示,干精矿含水率的实际值与预测值的最大相对差为8,预测值能很好地跟随实际值在01的范围内波动,反映实际值的变化趋势,但是很少有实际值和预测值能够完全吻合,预测精度有一定的起伏。
主元回归模型预测模型的校正由于上述模型在预测过程中部分结果误差较大,必须对模型进行校正。校正通常分为长期学习和短期学习,如所示,用以克服模型结构算法的复杂性与过程实时性要求之间的矛盾。
软测量模型校正示意图本文采用基于神经网络的自适应残差补偿方法[8]对主元回归模型给出的预测值进行补偿。补偿算法如下:yi=yi yi式中yi(i=1,2,,n)为干燥后精矿含水率的实际值,yi为主元回归模型给出的预测值,yi为实际值与预测值之差,即残差。yi=f(x1,x2,x3,x4,x5,x6)根据主元分析的结果,选取n组样本,采用改进的BP神经网络[9]进行训练,得到残差的预测模型。利用神经网络进行修正后的智能集成模型的预测曲线如所示。干精矿含水率的实际值与预测值的最大相对误差为4,小于主元回归模型的最大相对误差,建立的集成模型可以实现水分的在线检测。