样本加权的模糊聚类【基于加权直觉模糊集合的聚类模型】

　　摘要:针对已有基于直觉模糊集的聚类方法的局限性，提出了一种基于加权直觉模糊集合的聚类模型――WIFSCM（clustering model based on weighted intuitionistic fuzzy sets）。在该模型中，提出了特定特征空间下的等价样本和加权直觉模糊集合的概念；并推导出基于等价样本和加权直觉模糊集合的直觉模糊聚类算法的目标函数，利用该目标函数推导出直觉模糊聚类中心迭代算法和隶属度矩阵迭代算法；定义了基于加权直觉模糊集合的密度函数，确定了初始聚类中心，减少了迭代次数。通过灰度图像分割实验，证明了该模型的有效性，同时与普通直觉模糊集FCM聚类算法(IFCM)相比，聚类速度提高近百倍。
　　
　　关键词:直觉模糊集；加权直觉模糊集合；聚类中心；等价样本；隶属度矩阵；密度函数
　　
　　中图分类号: TP391.4 文献标志码:A
　　�
　　Clustering model based on weighted intuitionistic fuzzy sets
　　
　　�
　　CHANG Yan��*, ZHANG Shi.bin�(
　　School of Network Engineering, Chengdu University of Information Technology, Chengdu Sichuan 610225, China
　　
　　Abstract:
　　To make up the limitations of existing clustering methods based on intuitionistic fuzzy sets, a clustering model called WIFSCM (clustering model based on weighted intuitionistic fuzzy sets）is proposed based on weighted intuitionistic fuzzy sets. In this model, the concepts of equivalent samples and weighted intuitionistic fuzzy sets is put forward in special feature space, and based on which the objective function of intuitionistic fuzzy clustering algorithm is proposed. Iterative algorithms of clustering center and matrix of membership degree are inferred from the objective function. Density function based on weighted intuitionistic fuzzy sets is defined, and initial clustering center is gotten to reduce iterative times. The experiment of gray image segmentation shows that WIFSCM is effective ,and it is faster than IFCM algorithm nearly a hundred times.
　　
　　Concerning the limitations of the existing clustering methods based on intuitionistic fuzzy sets, a clustering model called Weighted Intuitionistic Fuzzy Set Model (WIFSCM) (clustering model based on weighted intuitionistic fuzzy sets）was proposed based on weighted intuitionistic fuzzy sets. In this model, the concepts of equivalent sample and weighted intuitionistic fuzzy set were put forward in special feature space, and based on which the objective function of intuitionistic fuzzy clustering algorithm was proposed. Iterative algorithms of clustering center and matrix of membership degree were inferred from the objective function. The density function based on weighted intuitionistic fuzzy sets was defined, and initial clustering center was gotten to reduce iterative times. The experiment of gray image segmentation shows that WIFSCM is effective, and it is faster than IFCM algorithm nearly a hundred times.�Key words:
　　intuitionistic fuzzy set; weighted intuitionistic fuzzy set；clustering center; equivalent sample; membership degree matrix; density function
　　
　　�
　　
　　0 引言�
　　
　　
　　
　　模糊数学理论�［1］在处理不精确与不确定性问题方面，形成了独特的理论体系与方法。而直觉模糊集理论�［2］更接近人的行为认知模式。直觉模糊集的特征是同时考虑隶属度和非隶属度两方面的信息, 这使得直觉模糊集在处理不确定性信息时比传统的模糊集有更强的表达能力,更具灵活性, 已经在医疗图像处理、模式识别、战场态势与威胁评估等领域取得成功应用。�
　　目前已有许多学者提出了多种基于模糊集的聚类方法,然而有关直觉模糊集的聚类问题的研究却较少，因此有必要对该类方法进行研究探讨。文献［3］中提出了直觉模糊集上的相似关系聚类算法并应用于心理学。文献［4］提出了用等价闭包的方式构造直觉模糊等价关系并用于直觉模糊聚类研究。文献［5］通过定义直觉模糊集之间的相似度进行直觉模糊聚类法的研究。这些聚类方法本质上都是先建立相似关系矩阵，再构造等价关系矩阵，通过选取置信阈值水平聚类，此类聚类算法应用前景良好，但由直觉模糊相似关系构造等价矩阵复杂费时，不适合海量数据的聚类，且聚类结果依赖置信水平选择。有许多学者将模糊C.均值(Fuzzy C.Means,FCM)算法推广到直觉模糊集。文献［6］提出了直觉模糊数的非监督模糊C.均值聚类算法。文献［7］将分类对象与聚类中心的关系推广为直觉模糊关系。文献［8-9］将分类对象和聚类中心及二者之间的关系都推广到直觉模糊集。但是这些无监督的动态优化算法,需要反复迭代类中心和模糊分割矩阵直至算法收敛,这种反复迭代的过程在样本数很大时,运算速度慢,限制了该算法的实际使用。�
　　针对大样本数据聚类时存在的以上问题，本文提出了一种基于加权直觉模糊集合的聚类模型――WIFSCM。该模型中依据等价样本策略缩减直觉模糊集合中的样本数，得到加权直觉模糊集合，并将FCM算法扩展到加权直觉模糊集合，并利用密度函数法确定初始聚类中心，大大提高聚类的有效性和快速性。�
　　1 WIFSCM模型框架�WIFSCM模型的主要思想是：1）利用直觉模糊集描述样本，从而使模型具有更强的表达能力,更具灵活性；2）用等价样本策略缩减直觉模糊集合中的样本数，得到加权直觉模糊集，从而减少运算量，节省运算时间和运算资源；3）利用加权直觉模糊集密度函数确定初始聚类中心，减少了迭代的次数，加快了收敛。WIFSCM模型框架如图1所示，主要由等价样本模型（Equivalent Sample Model，ESM）、加权直觉模糊集模型（Weighted Intuitionistic Fuzzy Set Model，WIFSM）、初始聚类中心模型（Initial Clustering Center Model，ICCM）、直觉模糊C均值聚类模型（Intuitionistic Fuzzy C.Means clustering Model，IFCMM）等构成。�
　　
　　2 实验分析�
　　为了证明本文模型的有效性和快速性，本章设计了两个实验。�
　　实验1 利用本文模型对图2所示灰度图像进行图像分割实验。由于图像像素的灰度值为一个［0,255］的数，那么在灰度空间中，灰度值相同的像素点可以认为是等价样本点。由此，不管原始图像有多大，经过等价样本模型后得到的权集中的样本个数始终不超过256。图3是对图2所示图像的样本的特征值的权值统计，也即对图2所示图像区域在256个灰度级上进行的一维灰度统计直方图。本文模型需要的加权直觉模糊集合可以通过图3的数据构造得出。�
　　图4是当聚类数目为5时，对图2进行图像分割的结果，聚类中心的灰度值为（238, 206, 178, 142, 94）。�实验2 对图2所示图像在不同图像分辨率，不同聚类中心数目情况下进行灰度空间的图像分割实验，并与IFCM算法进行比较。每组实验做3次，取平均值。结果如表1所示。�
　　
　　从表1可以看出，用WIFSCM模型进行图像分割所用的时间远远小于IFCM算法的平均运算时间。当图像尺寸不断变大时，两种算法所耗费时间的比例却不断降低，更加显示了WIFSCM模型对大数据样本集进行聚类的优势。
　　
　　3 结语�
　　本文受到已有研究的启发，提出了基于加权直觉模糊集合的聚类模型，该模型主要针对大样本集的聚类。该模型利用直觉模糊集描述样本，从而使模型具有更强的表达能力,更具灵活性；用等价样本策略缩减直觉模糊集合中的样本数，得到加权直觉模糊集合，从而提高了聚类速度；利用加权直觉模糊集合密度函数确定初始聚类中心，减少了迭代的次数，提高了收敛的速度。
　　
　　�参考文献:
　　［1］
　　ZADEH L A. Fuzzy sets［J］.Information and Control, 1965(8):338-356.
　　
　　［2］
　　ATANASSOV K．Intuitionistic fuzzy sets［J］．Fuzzy Sets and Systems，1986，20(1)：87-96.
　　
　　［3］
　　PASHA E A, FATEMI A. Intuitionistic fuzzy sets clustering (IFSC) with an application in psychology［J］.Journal of Mathematics and Applications,2006(28):113-120.
　　
　　［4］
　　雷英杰，王宝树，胡军红.直觉模糊等价矩阵构造方法［J］.系统工程理论与实践，2007,16（7）：127-131.
　　
　　［5］
　　张洪美，徐泽水，陈琦.直觉模糊集的聚类方法研究［J］.控制与决策，2007,22（8）：882-888.
　　
　　［6］
　　吴成茂.模糊C.均值算法在直觉模糊数聚类中的应用［J］.计算机工程与应用，2009,45（16）：141-145.
　　
　　［7］
　　徐小来,雷英杰,赵学军.基于直觉模糊熵的直觉模糊聚类［J］.空军工程大学学报, 2008, 9(2): 80-83.
　　
　　［8］
　　申晓勇, 雷英杰, 蔡茹, 等. 一种基于密度函数的直觉模糊聚类初始化方法［J］. 计算机科学,2009, 36(5): 197-199.
　　
　　［9］
　　申晓勇, 雷英杰, 蔡茹, 等. 基于目标函数的直觉模糊集合数据的聚类方法［J］. 系统工程与电子技术, 2009, 31(11): 2732-2735.

推荐访问:加权直觉模型集合