基于支持向量机的区域物流需求预测模型研究

[ 下载 ]

【摘要】本文针对区域物流需求问题，建立支持向量机预测模型。

运用基于改进求核算法的属性约简方法筛选预测指标，以货运量为目标函数，建立预测指标体系;进行数据的归一化处理，利用Lagrange乘子法、径向基核函数，建立SVM基本模型，并简述SVM参数确定的两种方法：五折交叉验证法、人工鱼群算法，最终建立完整的区域物流需求预测模型。

下载论文网　　【关键词】支持向量机属性约简法区域物流需求预测　　一、引言　　区域物流需求预测是物流系统发展的关键技术，可为上级管理部门规划和下级物流企业决策提供指导。

目前，我国广大学者为准确预测区域物流需求未来变化趋势，曾提出多种物流需求预测方法，而随着计算机发展、人工智能技术不断成熟，BP神经网络、支持向量机（SVM）等新型预测方法也孕育而生。

如何更为行之有效地进行区域物流需求预测，对整个区域内物流系统规划与管理、运行与决策具有重大意义。

二、预测指标体系　　（一）基于属性约简法的预测指标筛选　　根据国内经济物流发展情况与关系，初步确定区域物流需求八大预测指标：区域生产总值、第一产业产值、第二产业产值、第三产业产值、区域社会消费品零售总额、区域人均消费水平、区域进出口总额、区域快递业务量。

货运量为物流需求的量化变量。

为减少计算量，选用属性约简法进行指标筛选。

1.属性约简方法的选择。

属性约简[1—2]是粗糙集理论研究的核心内容之一。

属性组合爆炸是致使最小属性约简成为NP—hard问题的原因，因此为得到一个最优或次优的约简集，常常运用启发式算法。

基于正区域算法的属性约简无需建立可分辨矩阵，时间与空间复杂度相对可分辨矩阵较小，更具优势。

因此本文选用基于正区域算法的属性约简作为预测指标的筛选方法。

2.基于改进求核算法的属性约简。

篇幅限制，不再赘述粗糙集理论，下面详细介绍基于正区域算法的属性约简。

在粗糙集理论中，往往需要求出核，再利用启发式信息进行约简。

而核是通过正区域定义的，因此正区域的有效计算对整个属性约简至关重要。

目前最行之有效的算法之一是徐章艳等[3]设计的一种基于基数排序的改进的求核算法（正区域算法），时间复杂度为O（|C||U|），具体步骤如下：　　Step1：基于基数排序的属性连续化　　设决策表S={U，C，D，V，f}，条件属性集合C中元素α的最大、最小值分别为Mα、mα。

（1）取α最值间隔为1，根据包括首尾在内的间隔数建立相应数量的空队列; 　　（2）若？字存在于论域U中，将？字加至第f（？字，α）—m个队列中，修改该队列首尾的指针; 　　（3）count初始化为零; 　　（4）依次搜索队列，若为非空，则将该队列中所有元素在属性α上的值改为count，执行后count值自增1; 　　（5）得到在α上有序且值连续的新决策表S，其值域为[0，M’α]。

Step2：计算简化决策表S’ 　　其实质是删除决策表重复元素，定义如下：　　决策表S={U，D，D，V，f}中，记U/C={[u’1]C，[u’2]C，…，[u’m]C}，U’={u’1，…u’m}; 　　设POSC（D）=[ui1’]CU…U[uis’]C，其中？坌uis’∈U’且uis’/D的绝对值等于1（s=1，…，t）;记U’pos={ui1’，…，uit’}，U’neg=U’—U’pos，则有简化决策表S’={U’，C，D，V，f}。

计算步骤如下：　　（1）计算U/C={X1，X2，…，Xm}; 　　（2）对于？坌Xi∈U/C，若Xi/D的绝对值等于1，则任意取元素？字∈Xi，令x.is_pos=1，U’pos新增元素？字，反之？字.is+pos=0，U’heg新增元素？字。

Step3：基于简化决策表S’的改进求核算法　　（1）初始i=0，当i|C|时执行循环体，循环体每执行一次则i++，否则break; 　　（2）内部循环：　　循环1：　　若i≥0，则第i—1属性执行基数排序; 　　循环2：？字指向链表首地址; 　　循环3：若？字？埸？?I 　　循环3.1：　　若f（？字，D≠f（x→link，D）且？字与？字→link同属正区域的同一等价类或分属正负区域的同一等价类，　　则Core（C）=Core（C）U{ci}，break; 　　循环3.2：　　若？字与？字→link非同一等价类，则？字为链表下一元素指针; 　　（3）得到原始决策表S的核Core（C）。

以上提出的算法是基于不相容决策表执行的，对于相容或不相容决策表均能实现求解，适应范围广。

对于相容决策表，循环3.1执行条件可简化为f（？字，D）≠f（？字—link，D）且？字与？字→link属于同一等价类。

这样就得到基于正区域算法的属性约简结果。

（二）预测指标体系的建立　　以江苏省为例，根据江苏省统计年鉴，筛选后的预测指标为自变量，货运量为目标函数，建立区域物流预测指标体系，如下图所示：　　图1 江苏省物流需求预测指标体系　　受数据的可获得性限制，实际预测时可能会调整指标应用情况。

三、基于SVM的物流需求预测模型　　（一）预测模型的选择　　回归分析、时间序列均为线性模型，不能满足求出系统发展主要因素的条件;灰色关联分析具有样本需求少、计算简单的优势，然而根据通过原始数据预测未来的工作特点，其同样缺乏对影响因素的考虑;BP神经网络的自学习、自适应特性克服了非定量因素无法用数学公式严谨表达难题，较传统预测方法，精确性更高，但结果容易陷入局部最优、出现拟合或发生维数灾难。

而支持向量机[4—5]凭借结构风险最小化原理可避免BP神经网络过学习或欠学习现象，获得全局最优解，在处理有限样本问题中具有非线性拟合精度高、抗噪声性能强等无可比拟的强大优势。

（二）预测模型的建立　　1.数据归一化处理。

本文中七个输入输出指标量纲不一致，采用极差最大值变换法进行归一化处理，　　公式如下：　　　　通过上式将各指标数据转化至区间[—1，1]内，可以提高支持向量机收敛速度。

2.支持向量机基本模型。

支持向量机基本原理是通过非线性映射，将低维空间即输入因素x1，x2，…，xn变换到高维特征空间，从而进行线性建模，寻找输入输出变量之间的关系。

如下图所示：　　　　图2 STV原理图――最优分隔超平面　　设样本？字i为d维向量（i=1，2，…，n），训练集L={（？字i，yi）|i=1，2，…，n}，根据一个带有权值向量与偏置量的映射函数，在高维特征空间建立的数学模型为：f（？字）=ωT?φ（？字）+b（1）　　其中，ω、b分别为模型辨识参数――权值向量和偏置量。

根据最小风险原则，对辨识参数ω、b进行处理：　　（2）　　其中，C（ei）、Remp（f）、‖ω‖2分别为损失函数、经验风险和置信风险。

进一步分析，想要求解式（2），即可转化为一个约束优化问题：　　（3）　　其中，γ为惩罚系数（又称正则化系数），ei为误差。

为方便计算，上述约束优化方程组可利用Lagrange乘子αi，转换为以无约束优化问题形式存在于对偶空间内的方程，即：　　（4）　　至此，建立Lagrange函数后，SVM使优化问题转化为求解线性方程组。

令y=（y1，y2，…，yn）T，α=（α1，α2，…，αn）T，根据KKT条件可以得到矩阵：　　（5）　　其中，1N为元素向量，E为单位矩阵，　　在非线性数据建模中，人们普遍认为径向基（Radial basis function，简称RBF）函数性能为支持向量机众多核函数中最优，径向基函数为：　　（6）　　基于RBF函数构造的支持向量机分类函数为：　　（7）　　其中，σ为径向基函数的宽度系数。

3.支持向量机参数的确定。

在SVM算法中，根据其工作原理可知，惩罚系数γ与核函数宽度系数σ是支持向量机学习性能的共同决定参数，两参数值的大小决定了拟合情况的好坏。

现常采用的参数确定方法为交叉验证法，这里选用五折交叉检验法，具体方法不再赘述。

取多次交叉检验的差错率的均值，重复多次交叉验证，再取平均，得到对算法精度的估计值。

参考文献[6]提出利用人工鱼群算法优化参数，通过模仿鱼群觅食追尾行为，进行高效率搜索，根据文章中给出的算法流程，总结出以下物流预测步骤：　　图3 物流预测步骤流程图　　四、结语　　区域物流需求预测是个复杂的建模过程，通过上文研究，可以得到整个建模流程：确定研究对象;了解背景，查阅相关资料;分析研究对象影响因素，初步确定指标;利用改进属性约简法分析筛选预测指标，确立预测指标体系;选择SVM作为预测模型;建立预测模型;在最后，收集到原始数据后，需对不同的预测方法进行检验分析，并证明预测结果合理性。

参考文献　　[1]黄鑫.基于DTRS—SVM模型的广东省物流需求预测研究[D].广东工业大学，2015. 　　[2]邹志超.基于正区域的属性约简算法的研究和改进[D].暨南大学，2011. 　　[3]徐章艳，刘作鹏，杨炳儒.一个复杂度为max（O（||U|），O（|C|～2|U/C|））的快速属性约简算法[J].计算机学报，03：391—399，2006. 　　[4]梁毅刚，耿立艳，张占福.基于核主成分――最小二乘支持向量机的区域物流需求预测[J].铁道运输与经济，34（11）：63—67，2012. 　　[5]李自立.基于支持向量机的区域物流需求预测研究[D].武汉科技大学，2009. 　　[6]陈海英，张萍，柳合龙.人工鱼群算法优化支持向量机的物流需求预测模型研究[J].数学的实践与认识，46（2）：69—75，2016. 　　基金项目：本论文受2016年大学生创新创业训练计划项目（xcx2016021）资助。

作者简介：葛彦（1997—），女，江苏南通人，学历：本科;赵红梅（1971—），女，安徽人，学历：博士研究生，职称：教授。

2 次访问