基于支持向量机的区域物流需求预测模型研究

【摘要】本文针对区域物流需求问题,建立支持向量预测模型

运用基于改进求核算法属性约简方法筛选预测指标,以货运量为目标函数,建立预测指标体系;进行数据的归一化处理,利用Lagrange乘子法、径向基核函数,建立SVM基本模型,并简述SVM参数确定的两种方法:五折交叉验证法、人工鱼群算法,最终建立完整的区域物流需求预测模型

下载论文网    【关键词】支持向量属性约简区域物流 需求预测   一、引言   区域物流需求预测物流系统发展的关键技术,可为上级管理部门规划和下级物流企业决策提供指导。

目前,我国广大学者为准确预测区域物流需求未来变化趋势,曾提出多种物流需求预测方法,而随着计算机发展、人工智能技术不断成熟,BP神经网络、支持向量机(SVM)等新型预测方法也孕育而生。

如何更为行之有效地进行区域物流需求预测,对整个区域物流系统规划与管理、运行与决策具有重大意义。

二、预测指标体系   (一)基于属性约简法的预测指标筛选   根据国内经济物流发展情况与关系,初步确定区域物流需求八大预测指标:区域生产总值、第一产业产值、第二产业产值、第三产业产值、区域社会消费品零售总额、区域人均消费水平、区域进出口总额、区域快递业务量。

货运量为物流需求的量化变量。

为减少计算量,选用属性约简法进行指标筛选。

1.属性约简方法的选择。

属性约简[1—2]是粗糙集理论研究的核心内容之一。

属性组合爆炸是致使最小属性约简成为NP—hard问题的原因,因此为得到一个最优或次优的约简集,常常运用启发式算法

基于区域算法属性约简无需建立可分辨矩阵,时间与空间复杂度相对可分辨矩阵较小,更具优势。

因此本文选用基于区域算法属性约简作为预测指标的筛选方法。

2.基于改进求核算法属性约简

篇幅限制,不再赘述粗糙集理论,下面详细介绍基于区域算法属性约简

在粗糙集理论中,往往需要求出核,再利用启发式信息进行约简

而核是通过正区域定义的,因此正区域的有效计算对整个属性约简至关重要。

目前最行之有效的算法之一是徐章艳等[3]设计的一种基于基数排序的改进的求核算法(正区域算法),时间复杂度为O(|C||U|),具体步骤如下:   Step1:基于基数排序的属性连续化   设决策表S={U,C,D,V,f},条件属性集合C中元素α的最大、最小值分别为Mα、mα。

(1)取α最值间隔为1,根据包括首尾在内的间隔数建立相应数量的空队列;   (2)若?字存在于论域U中,将?字加至第f(?字,α)—m个队列中,修改该队列首尾的指针;   (3)count初始化为零;   (4)依次搜索队列,若为非空,则将该队列中所有元素在属性α上的值改为count,执行后count值自增1;   (5)得到在α上有序且值连续的新决策表S,其值域为[0,M’α]。

Step2:计算简化决策表S’   其实质是删除决策表重复元素,定义如下:   决策表S={U,D,D,V,f}中,记U/C={[u’1]C,[u’2]C,…,[u’m]C},U’={u’1,…u’m};   设POSC(D)=[ui1’]CU…U[uis’]C,其中?坌uis’∈U’且uis’/D的绝对值等于1(s=1,…,t);记U’pos={ui1’,…,uit’},U’neg=U’—U’pos,则有简化决策表S’={U’,C,D,V,f}。

计算步骤如下:   (1)计算U/C={X1,X2,…,Xm};   (2)对于?坌Xi∈U/C,若Xi/D的绝对值等于1,则任意取元素?字∈Xi,令x.is_pos=1,U’pos新增元素?字,反之?字.is+pos=0,U’heg新增元素?字。

Step3:基于简化决策表S’的改进求核算法   (1)初始i=0,当i|C|时执行循环体,循环体每执行一次则i++,否则break;   (2)内部循环:   循环1:   若i≥0,则第i—1属性执行基数排序;   循环2:?字指向链表首地址;   循环3:若?字?埸??I   循环3.1:   若f(?字,D≠f(x→link,D)且?字与?字→link同属正区域的同一等价类或分属正负区域的同一等价类,   则Core(C)=Core(C)U{ci},break;   循环3.2:   若?字与?字→link非同一等价类,则?字为链表下一元素指针;   (3)得到原始决策表S的核Core(C)。

以上提出的算法基于不相容决策表执行的,对于相容或不相容决策表均能实现求解,适应范围广。

对于相容决策表,循环3.1执行条件可简化为f(?字,D)≠f(?字—link,D)且?字与?字→link属于同一等价类。

这样就得到基于区域算法属性约简结果。

(二)预测指标体系的建立   以江苏省为例,根据江苏省统计年鉴,筛选后的预测指标为自变量,货运量为目标函数,建立区域物流预测指标体系,如下图所示:   图1 江苏省物流需求预测指标体系   受数据的可获得性限制,实际预测时可能会调整指标应用情况。

三、基于SVM的物流需求预测模型   (一)预测模型的选择   回归分析、时间序列均为线性模型,不能满足求出系统发展主要因素的条件;灰色关联分析具有样本需求少、计算简单的优势,然而根据通过原始数据预测未来的工作特点,其同样缺乏对影响因素的考虑;BP神经网络的自学习、自适应特性克服了非定量因素无法用数学公式严谨表达难题,较传统预测方法,精确性更高,但结果容易陷入局部最优、出现拟合或发生维数灾难。

而支持向量机[4—5]凭借结构风险最小化原理可避免BP神经网络过学习或欠学习现象,获得全局最优解,在处理有限样本问题中具有非线性拟合精度高、抗噪声性能强等无可比拟的强大优势。

(二)预测模型的建立   1.数据归一化处理。

本文中七个输入输出指标量纲不一致,采用极差最大值变换法进行归一化处理,   公式如下:      通过上式将各指标数据转化至区间[—1,1]内,可以提高支持向量机收敛速度。

2.支持向量机基本模型

支持向量机基本原理是通过非线性映射,将低维空间即输入因素x1,x2,…,xn变换到高维特征空间,从而进行线性建模,寻找输入输出变量之间的关系。

如下图所示:      图2 STV原理图――最优分隔超平面   设样本?字i为d维向量(i=1,2,…,n),训练集L={(?字i,yi)|i=1,2,…,n},根据一个带有权值向量与偏置量的映射函数,在高维特征空间建立的数学模型为:f(?字)=ωT?φ(?字)+b(1)   其中,ω、b分别为模型辨识参数――权值向量和偏置量。

根据最小风险原则,对辨识参数ω、b进行处理:    (2)   其中,C(ei)、Remp(f)、‖ω‖2分别为损失函数、经验风险和置信风险。

进一步分析,想要求解式(2),即可转化为一个约束优化问题:    (3)   其中,γ为惩罚系数(又称正则化系数),ei为误差。

为方便计算,上述约束优化方程组可利用Lagrange乘子αi,转换为以无约束优化问题形式存在于对偶空间内的方程,即:    (4)   至此,建立Lagrange函数后,SVM使优化问题转化为求解线性方程组。

令y=(y1,y2,…,yn)T,α=(α1,α2,…,αn)T,根据KKT条件可以得到矩阵:    (5)   其中,1N为元素向量,E为单位矩阵,   在非线性数据建模中,人们普遍认为径向基(Radial basis function,简称RBF)函数性能为支持向量机众多核函数中最优,径向基函数为:    (6)   基于RBF函数构造的支持向量机分类函数为:    (7)   其中,σ为径向基函数的宽度系数。

3.支持向量机参数的确定。

在SVM算法中,根据其工作原理可知,惩罚系数γ与核函数宽度系数σ是支持向量机学习性能的共同决定参数,两参数值的大小决定了拟合情况的好坏。

现常采用的参数确定方法为交叉验证法,这里选用五折交叉检验法,具体方法不再赘述。

取多次交叉检验的差错率的均值,重复多次交叉验证,再取平均,得到对算法精度的估计值。

参考文献[6]提出利用人工鱼群算法优化参数,通过模仿鱼群觅食追尾行为,进行高效率搜索,根据文章中给出的算法流程,总结出以下物流预测步骤:   图3 物流预测步骤流程图   四、结语   区域物流需求预测是个复杂的建模过程,通过上文研究,可以得到整个建模流程:确定研究对象;了解背景,查阅相关资料;分析研究对象影响因素,初步确定指标;利用改进属性约简法分析筛选预测指标,确立预测指标体系;选择SVM作为预测模型;建立预测模型;在最后,收集到原始数据后,需对不同的预测方法进行检验分析,并证明预测结果合理性。

参考文献   [1]黄鑫.基于DTRS—SVM模型的广东省物流需求预测研究[D].广东工业大学,2015.   [2]邹志超.基于区域属性约简算法的研究和改进[D].暨南大学,2011.   [3]徐章艳,刘作鹏,杨炳儒.一个复杂度为max(O(||U|),O(|C|~2|U/C|))的快速属性约简算法[J].计算机学报,03:391—399,2006.   [4]梁毅刚,耿立艳,张占福.基于核主成分――最小二乘支持向量机的区域物流需求预测[J].铁道运输与经济,34(11):63—67,2012.   [5]李自立.基于支持向量机的区域物流需求预测研究[D].武汉科技大学,2009.   [6]陈海英,张萍,柳合龙.人工鱼群算法优化支持向量机的物流需求预测模型研究[J].数学的实践与认识,46(2):69—75,2016.   基金项目:本论文受2016年大学生创新创业训练计划项目(xcx2016021)资助。

作者简介:葛彦(1997—),女,江苏南通人,学历:本科;赵红梅(1971—),女,安徽人,学历:博士研究生,职称:教授。

2 次访问