粗集一遗传支持向量机模型在供应链绩效评价中的应用

武雯娟

（泰安职业技术学院财经系，山东泰安２７１０００）

摘要：将粗集－遗传支持向量机模型运用到供应链绩效评价中，首先利用粗集理论剔除影响供应链绩效评价的冗余因素，获得核心影响因素，再采用支持向量机对于提取得到的核心影响因素预测供应链绩效所处的级别。在支持向量机分类过程中，利用遗传算法对支持向量机算法的参数进行寻优，获得最佳参数模型，而后预测得到供应链绩效评价级别。最后，实例运用此模型进行了预测，并与只运用粗集－支持向量机进行预测的结果进行对比。结果表明，利用粗集－遗传支持向量机方法对供应链绩效评价级别的预测准确率更高，预测结果更符合实际，是一种科学可行的方法。

教育期刊网 http://www.jyqkw.com
关键词：供应链；绩效评价；粗集理论；支持向量机；遗传算法

中图分类号：ＴＰ１８文献标识码：A文章编号：0439－８114（２０15）03－0７３３-0５

随着经济全球化，企业的经营环境发生了巨大的变化。越来越多的企业管理者已经意识到，未来的企业竞争将是供应链（Supply Ｃｈａｉｎ，简称ＳＣ）与供应链之间的竞争，而不是企业之间的竞争。企业为了在市场竞争中始终处于有利地位，获得长期竞争优势及利益，就必须建立高效、安全、可靠的供应链系统，供应链系统可以各种辅助手段实现其一体化过程。

所谓供应链是指将产品和服务提供给最终消费者的所有环节的企业所构成的上下游产业一体化的体系。供应链管理是从系统的观点出发，通过对采购、制造、分销直至消费者的整个过程中的资金流、物流、信息流的协调，通过此种管理模式来满足消费者的要求及需求。然而只有对供应链系统中的各成员供应链绩效评价理论及其重要性的认识统一，才能让他们将对整个供应链系统的贡献度作为自己的考核目标，并将这些具体指标达成情况作为利益分配及任务分配的依据，如此才能使供应链的整体绩效切实得到提高。目前，将粗集－遗传支持向量机（ＧＡ－ＳＶＭ）方法应用到供应链绩效评价领域的研究并不多见，本研究主要利用粗糙集理论剔除供应链绩效评价的冗余因素及指标，提取获得影响供应链绩效评价的核心因素，再运用对于小样本具有良好泛化能力的支持向量机来进行评价，支持向量机的评价过程中通过遗传算法来进行相关参数寻优操作［１，２］。

１粗集理论

波兰学者Ｐａｗｌａｋ于１９８２年提出了粗糙集（ＲｏｕｇｈＳｅｔ）理论，粗糙集理论就是在无需提供问题需要处理数据之外的任何其他先知信息，而是仅根据已知的数据剔除冗余信息，获得本质信息，分析得到知识的不完整程度，生成决策或分类的相关规则及准则，实现通过分类准则或规则对已知数据进行精简或约减，对于处理未确知和模糊数据具有良好的效果［３－５］。

１．１信息系统

一个信息系统Ｓ通过下式表示：Ｓ＝（Ｕ，Ａ，Ｖ，ｆ），其中Ｕ为论域，（Ｕ＝｛ｘ１，ｘ２，……，ｘｎ｝）由有限个研究对象组成；Ａ＝Ｃ∪Ｄ为属性集，其中Ｃ是条件属性集，Ｄ是决策属性集；Ｖ是值域；ｆ是映射，对ａ∈Ａ，ｘ∈Ｕ，实现关于属性ａ的值。

１．２不可区分关系

粗糙集理论将知识和分类紧密联系起来，知识是对客观数据进行分类的能力，分类就是将差别的数据对象分析成为一类，它们之间的关系称之为不可分辨关系或等价关系，其中知识库可以用Ｋ＝（Ｕ，Ｒ）表示，其中Ｕ是非空有限集，称之为论域，Ｒ是Ｕ上的一族等价关系。ＵΠＲ为Ｒ的所有等价类族。［X］Ｒ表示包含元素ｘ∈Ｕ的Ｒ的等价类。若yyＰＲ且Ｐ≠?椎，则Ｐ中全部等价关系的交集也是一种等价关系，称为Ｐ上的不可区分关系，记为ｉｎｄ（ｐ），

１．３属性约简与核

定义１：假设Ｓ＝（Ｕ，Ｒ）为信息系统，Ｒ是Ｕ上的等价关系族，ｘ∈Ｒ，若Ｕ／ＩＮＤ（Ｒ）＝Ｕ／ＩＮＤ（Ｒ－ｒ），则称是Ｒ中可以被约简掉的知识，否则不可被约简掉。

定义２：对于任意ｒ∈Ｐ（ＰＲ），若其中的Ｐ都是不可被约简的，则其等价关系族Ｐ是独立的，否则认为Ｐ是相关的。

定义３：假定Ｓ＝（Ｕ，Ｒ）为信息系统，如果子族ＰＲ满足下列条件：ＩＮＤ（Ｐ）＝ＩＮＤ（Ｒ），而且Ｐ是独立的，则称Ｐ是Ｒ的一个约简。

如果Ｐ是Ｒ的约简，则Ｐ必须满足以下条件：①Ｐ独立；②Ｐ与Ｒ有相同的分类能力，即ＩＮＤ（Ｐ）＝ＩＮＤ（Ｒ）。

定义４：假定Ｓ＝（Ｕ，Ｒ）为信息系统，如果其中Ｒ不可约去的属性，则称做Ｒ是核属性，所有核属性构成的集合称为核集，记作Ｃｏｒｅ（Ｒ），称Ｃｏｒｅ（Ｒ）为Ｒ的核。

１．４粗集的上、下近似及边界

定义１：给定知识库Ｋ＝（Ｕ，Ｒ），ＸＵ，称y（Ｘ）＝｛x｜［x］ＲＸ，ｘ∈Ｕ｝为集合Ｘ的下近似，也称（Ｘ）是Ｘ的Ｒ正域，记做ＰＯＳＲ（Ｘ）；显然，Ｘ的Ｒ正域ＰＯＳＲ（Ｘ）是由Ｕ中完全属于Ｘ的元素构成的集合。（Ｘ）是一个确定性集合，它是由完全包含在Ｘ中的那些Ｒ的等价类（中的元素）构成的集合。即Ｘ的Ｒ正域ＰＯＳＲ（Ｘ）中的元素可被正确分类。

定义２：称ＢＮＲ（Ｘ）＝（Ｘ）－（Ｘ）为Ｘ的Ｒ边界域，称ＮＥＧＲ（Ｘ）＝Ｕ－（Ｘ）为Ｘ的负域。显见，负域中的元素由不能确定是否属于Ｘ的元素组成。

１．５决策表的简化

对于决策表的条件属性进行化简，也就是对决策表的简化，简化的决策表具有与之前的决策表相同的决策等功能，不影响其核心功能的体现，只不过是简化后的决策表具有更少的条件属性，这样会提高决策和评价效率。因此，决策表的简化在实际应用领域中占有相当分量。换言之，在更少的条件下，获得同样的决策，使得利用一些相对之前更为简单的手段或条件就可以获得同样的决策或结果。决策表的简化步骤如下：（１）对决策表的条件属性进行约简，获得核心因素，也就是消去决策表中的某些列；（２）约简掉决策表中重复的某些行消去重复的行；（３）约简掉属性的冗余值。

本研究主要通过以上３个步骤对决策表进行属性约简，以期得到影响供应链绩效评价的主要因素或指标，约简掉冗余因素或指标，为下一步的供应链支持向量机评价奠定一个良好的基础。

２遗传－支持向量机回归模型

２．１支持向量机基本原理

ＳＶＭ是基于结构风险最小化原则的方法，由于其是一个凸二次优化问题，从而保证能找到一个全局最优解，而且其能够较好地解决小样本、非线性、高维数等实际问题，问题的复杂程度不再简单地取决于维数高低，并且具有良好的泛化能力［６－８］。对于其凸二次优化问题，可以应用标准的拉格朗日乘子法进行优化求解。

假设训练样本为｛（ｘ１，ｙ１），……（ｘｉ，ｙｉ）｝，其中（ｘｉ∈Ｒｍ）是第ｉ个学习样本的输入值，且为ｍ维列向量，ｙｉ∈Ｒ为对应的目标值。可以建立如下形式的回归函数：

式（１）中，｛｝表示内积运算，ｗｉ描述了函数ｆｉ（ｔ）的复杂度，ｂｉ为常数。考虑到函数的复杂度和拟合误差，函数拟合问题等价于满足如下约束条件时

最小化代价泛函

式（３）中，Ｃ为惩罚因子，?孜ｉ为松弛变量。对于这个寻优问题，可以建立以下函数

式（４）中，（αｉ）ｌ为Ｌａｇｒａｎｇｅ乘子。考察式（２）所给函数极值存在条件，可以获得求解所有参数的一个方程组，并最终得到回归函数（１）的表达式为

式（５）中，Ｋｉ（ｔ，ｔｌ）为满足Ｍｅｒｃｅｒ条件的支持向量机核函数。广泛应用一种核函数为径向基核函数

式（６）中，ｉ为ｘｉ的标准偏差。

当每个训练数据所对应的回归函数ｆｉ（ｔ）均被确定后，可以得到回归函数为

支持向量机回归模型中具有多个参数，易陷入局部最优，因此本研究利用具有全局寻优能力的遗传算法对其参数进行寻优。

２．２遗传算法基本原理

遗传算法和传统搜索算法不同，它首先随机产生一组初始解，即“种群（Ｐｏｐｕｌａｔｉｏｎ）”，种群中的每一个个体，即问题的一个解向量，称为“染色体（Ｃｈｒｏｍｏｓｏｍｅ）”，开始搜索过程。这些染色体在后续迭代中不断进化，生成的下一代染色体称为“后代（Ｏｆｆｓｐｒｉｎｇ）”。每一代中染色体的好坏可通过染色体的适应值（Ｆｉｔｎｅｓｓ）来评价：适应值大的染色体被选择的几率高，相反，适应值小的染色体被选择的可能性小，被选择的染色体通过交叉（Ｃｒｏｓｓｏｖｅｒ）和变异（Ｍｕｔａｔｉｏｎ）产生新的染色体，即后代；经过若干代之后，算法收敛于最好的染色体，该染色体很可能就是问题的最优解或近似最优解。遗传算法的运行步骤如下［９－１５］：（１）随机产生初始种群popk；（２）以适应度函数对染色体进行评价；（３）按适应值高低选择染色体形成新种群newpopk；（４）通过交叉、变异操作产生新的染色体即后代offspring；（５）不断重复步骤（２）－（４），直到获得预定进化代数。

其迭代流程见图１所示。由上述步骤可看出，遗传算法主要由遗传运算（交叉和变异）和进化运算（选择）组成。

交叉运算是最主要的遗传运算，遗传算法的性能在很大程度上取决于所采用的交叉运算的性能。交叉运算同时对两个染色体操作，组合两者的特性产生新的后代。变异则是一种基本运算，它在染色体上自发产生随机变化。变异可以提供初始种群中不含有的基因，或找回选择过程中丢失的基因，为种群提供新的内容。

３实证分析

设计任何评价指标体系都应遵循一些基本原则，因此，本研究结合供应链绩效评价的概念，根据目的性原则、科学性原则、系统性原则、经济性原则、定量与定性相结合的原则和通用性与发展性相结合原则这六个原则初步确定一个比较广泛的供应链绩效评价指标体系（表１）。同时，对评价指标代号及指标类型进行了标定。其中，极大型指标是指标值越大越好的指标，又称正向指标；极小型指标是指标值越小越好的指标，又称逆向指标。本研究应用这一指标体系对河北、山东、天津等地区的１４条供应链进行调研，调查的实际数据请相关专家进行评分，其评分结果将作为支持向量机评价结果进行训练和检验，同时也作为和只运用支持向量机所得出的训练结果进行比较（表２）［１，２］。

３．１粗集属性约简

把实测数据输入，把这些指标作为条件属性。对于供应链绩效评价结果根据所处情况分为五类（很好，较好、一般、不好、很不好），作为决策属性记为Ｄ｛１，２，３，４，５｝，

对决策表进行属性约简，根据粗集理论可以求出哪些是核心属性，哪些是冗余属性，由于属性约简算法比较复杂，采用ＶＢ６．０编程进行属性约简。属性约简后的指标体系见表２。此指标体系由于约简了冗余属性，提取了核心属性，为下一步利用支持向量机进行回归识别提供了比较好的基础。

把通过实际调研的数据输入约简后的决策表（表３）。

３．２遗传－支持向量机回归模型的学习

支持向量机学习算法如下：

１）获取学习样本（ｘｉ，ｙｉ），ｉ＝１，２，……ｌ，其中ｘｉ∈Ｒｍ，ｙｉ∈｛１，－１｝ｌ对样本进行预处理。

２）选择进行非线性变换的核函数及对错分（误差）进行惩罚的惩罚因子Ｃ。

３）形成二次优化问题用优化方法。对于此优化问题中参数寻优，通过遗传算法获得，具体步骤如下：①确定遗传算法编码方式。采用十进制整数编码的遗传算法的群体中模式的数目，低阶并且适应度值在群体平均适应度值以上的模式在遗传算法迭代过程中将按指数增长率被采样。②生成初始种群。初始染色体的多少对遗传算法的搜索有影响，对支持向量机算法具有显著影响，为了优化模型往往需要对染色体参数进行适当优化。根据采集数据情况，确定初始种群染色体数目。③计算每个染色体的适应度值ｆ（ｘｉ），ｘｉ为种群中第ｉ个染色体；④累加所有染色体的适应度值ｓｕｍ＝∑ｆ（ｘｉ），同时记录对于每一个染色体的中间累加值Ｓ－ｍｉｄ，其中Ｓ为总数目；⑤产生一个随机数Ｎ，０＜Ｎ＜ｓｕｍ；⑥选择其对应的中间累加值Ｓ－ｍｉｄ≥Ｎ的第一个染色体进入交换集；⑦重复步骤⑤、⑥操作，直到交换集中包含足够多的染色体为止；⑧对于步骤⑦产生的染色体中任意选择两个染色体，染色体进行单点杂交和两点杂交获得一个或多个基因，得到新的两个染色体，来产生新的优良品种；⑨变异运算利用各种偶然因素引起的基因突变，以给定的概率随机地改变遗传基因的值。⑩通过步骤①到步骤⑨获得支持向量机算法的惩罚系数、松弛变量等参数，遗传算法寻优结束。

４）获得αｉ以及ｂ的值，代入方程中，获得函数拟合的支持向量机。

５）将需预测或分类的数据代入支持向量机方程中获得结果。

本研究中所选评价指标作为供应链评价因素集，供应链绩效评价等级分为５级，目标输出对应以下５类：１、２、３、４、５。

利用表２中的前１０数据作为训练样本，对于数据采用以下公式进行归一化处理，以减少各个因子不同量级对于回归效果的影响，并利用Ｍａｔｌａｂ软件得出回归结果（图2）。

由图2可以看出拟合效果非常好，从而可以对剩下的４个进行识别，并与采用ＢＰ神经网络对１０到１４的样本进行评判的结果进行对比（表４）。

通过表４可见，基于粗集的支持向量机识别等级与支持向量机识别的等级除了编号１２之外都一样，通过对编号１２的数据进行进一步分析可以得出此供应链绩效等级更趋近于一般等级。

４结论

本研究首先利用粗集理论提取出影响供应链绩效评价的核心因素，再使用支持向量机的方法进行模式识别，模式识别过程中，利用遗传算法对相关参数进行寻优操作，取得了良好的效果。由于支持向量机是基于小样本的分类及预测的模型。所以，在本研究实例所给样本极少的情况下做出了较好的预测。由于支持向量机方法是建立在有限样本下进行机器学习的通用方法，因此它在供应链绩效评价和分析中有广泛的应用前景。

教育期刊网 http://www.jyqkw.com
参考文献：

［１］王德财．基于支持向量机的供应链绩效评价方法研究［Ｄ］．长沙：长沙理工大学，２００６．

［２］蔡炜凌．企业供应链项目的综合评价方法研究［Ｄ］．河北保定：华北电力大学，２００７．

［３］曹庆奎，任向阳，刘琛，等．基于粗集－未确知测度模型的企业技术创新能力评价研究［Ｊ］．系统工程理论与实践，２００６，９（４）：６７－７２．

［４］张文修，吴伟志．粗糙集理论与方法［Ｍ］．北京：科学出版社，２００３．

［５］柯孔林，冯宗宪．基于粗糙集与遗传算法集成的企业短期贷款违约判别［Ｊ］．系统工程理论与实践，２００８，９（４）：２７－３４．

［６］ＢＡＮＥＲＪＥＥＭ，ＣＨＡＫＲＡＢＯＲＴＹＭＫ．Ａｃａｔｅｇｏｒｙｆｏｒｒｏｕｇｈｓｅｔｓ［Ｊ］．ＦｏｕｎｄａｔｉｏｎｓｏｆＣｏｍｐｕｔｉｎｇａｎｄＤｅｃｉｓｉｏｎＳｃｉｅｎｃｅｓ，１９９３，１８（３－４）：１６７－１８０．

［７］李顺国，卢新元．基于粗糙集和ＳＶＭ的工程项目投标风险研究［Ｊ］．计算机工程与应用，２００８，４４（１７）：２２４－２２７．

［８］苏怀智，温志萍，吴中如．基于ＳＶＭ理论的大坝安全预警模型研究［Ｊ］．应用基础与工程科学学报，２００９，１７（１）：４０－４７．

［９］赵洪波，冯夏庭．非线性位移时间序列预测的进化——支持向量机方法及应用［Ｊ］．岩土工程学报，２００３，２５（４）：４６８－４７１．

［１０］ＰＥＴＬＥＹＤＮ，ＭＡＮＴＯＶＡＮＩＦ，ＢＵＬＭＥＲＭＨ，ｅｔａｌ．Ｔｈｅｕｓｅｏｆｓｕｒｆａｃｅｍｏｎｉｔｏｒｉｎｇｄａｔａｆｏｒｔｈｅｉｎｔｅｒｐｒｅｔａｔｉｏｎｏｆｌａｎｄｓｌｉｄｅｍｏｖｅｍｅｎｔｐａｔｔｅｒｎｓ［Ｊ］．Ｇｅｏｍｏｒｐｈｏｌｏｇｙ，２００５，６６（１－４）：１３３－１４７.

［１１］ＶＡＬＬＥＪＯＬＥ，ＳＨＥＴＴＩＭＡＭ．Ｃｒｅｅｐｃｒａｃｋｐｒｏｐａｇａｔｉｏｎａｎｄｔｈｅｐｒｏｇｒｅｓｓｉｖｅｆａｉｌｕｒｅｏｆｓｌｏｐｅｓ［Ａ］．Ｉｎ：Ｄｅｆｏｒｍａｔｉｏｎａｎｄｐｒｏｇｒｅｓｓｉｖｅｆａｉｌｕｒｅｉｎｇｅｏｍｅｃｈａｎｉｃｓ［Ｃ］．Ｌｏｎｄｏｎ：ＰｅｒｇｍｏｎＰｒｅｓｓ，１９９７．

［１２］ＢＥＴＴＥＮＪ．Ｃｒｅｅｐｍｅｃｈａｎｉｃｓ［Ｍ］．２ｎｄｅｄ．Ｂｅｒｌｉｎ：Ｓｐｒｉｎｇｅｒ，２００５．

［１３］ＭＡＮＤＩＣＤＰ，ＧＯＬＺＭ，ＫＵＨＡ，ｅｔａｌ．Ｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇｔｅｃｈｎｉｑｕｅｓｆｏｒｋｎｏｗｌｅｄｇｅｅｘｔｒａｃｔｉｏｎａｎｄｉｎｆｏｒｍａｔｉｏｎｆｕｓｉｏｎ［Ｍ］．Ｂｅｒｌｉｎ：Ｓｐｒｉｎｇｅｒ，２００７．

［１４］ＫＬＩＯＮＳＫＩＤＭ，ＯＲＥＳＨＫＯＮＩ，ＧＥＰＰＥＮＥＲＶＶ，ｅｔａｌ．Ａｐｐｌｉｃａｔｉｏｎｓｏｆｅｍｐｉｒｉｃａｌｍｏｄｅｄｅｃｏｍｐｏｓｉｔｉｏｎｆｏｒｐｒｏｃｅｓｓｉｎｇｎｏｎｓｔａｔｉｏｎａｒｙｓｉｇｎａｌｓ［Ｊ］．ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎａｎｄＩｍａｇｅＡｎａｌｙｓｉｓ，２００８，１８（３）：３９０－３９９．

［１５］ＬＥＥＹＳ，ＴＳＡＫＩＲＴＺＩＳＳ，ＶＡＫＡＫＩＳＡＦ，ｅｔａｌ．Ｐｈｙｓｉｃｓ－ｂａｓｅｄｆｏｕｎｄａｔｉｏｎｆｏｒｅｍｐｉｒｉｃａｌｍｏｄｅｄｅｃｏｍｐｏｓｉｔｉｏｎ［Ｊ］．ＡＩＡＡＪｏｕｒｎａｌ，２００９，４７（１２）：２９３８－２９６３．