增量聚类算法的研究与设计Research and Design of Incremental Cluster Algorithm
高燕飞,陈俊杰,乔冰琴
摘要(Abstract):
在数据挖掘领域,聚类是对数据初始的处理。动态系统中,由于经常要增加一些新的数据,如果每次对新增的数据都重新聚类,这样就既浪费时间又浪费资源。首先介绍了聚类的基本概念和聚类的分类,在此基础上提出的一种基于特征向量的聚类算法,它只对新增的数据聚类,这样就会节省大量的资源和时间。通过实验,在动态系统中对新增的数据用该增量聚类算法和重新聚类的算法相比较,最后得出结论,该增量聚类算法是可行的。
关键词(KeyWords): 聚类算法;特征向量;增量聚类
基金项目(Foundation): 国家自然科学基金(60773004)
作者(Author): 高燕飞,陈俊杰,乔冰琴
参考文献(References):
- [1]白洁,李春平.面向软件开发信息库的数据挖掘综述[J].计算机应用研究,2008,25(1):22-29.
- [2]李明华,刘全,刘忠,等.数据挖掘中聚类算法的新发展[J].计算机应用研究,2008,25(1):13-18.
- [3]孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008,19(1):48-61.
- [4]王迎敏.牛保宁.基于SLO的负载管理技术[J].电脑开发与应用.2010,23(10):12-15.
- [5]NIU BAONING,PATRICK MARTIN,WENDY POWLEY.Towards Autonomic Workload Management in DBMSs[J].Journal ofDatabase Management,2009,20(3):1-17.
- [6]陈黎飞,姜青山,王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报,2008,19(1):62-72.
- [7]童健华,谭洪舟,郭雷勇.一种改进的人工免疫文本聚类算法[J].系统仿真学报,2010,22(1):29-33.
- [8]王玲,薄列峰,焦李成.密度敏感的半监督谱聚类[J].软件学报,2007,18(10):2412-2422.
- [9]吴磊,彭德中,彭磊,等.结合Mercer核与SOM的动态免疫网络聚类算法[J].小型微型计算机系统,2010,31(2):333-338.
- [10]张靖,姚珍,唐雪飞.基于决策树的不完整数据的处理[J].电子科技大学学报;2007,36(1):116-119.