太原科技大学学报

2015, v.36;No.148(02) 92-96

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于大数据平台hadoop的聚类算法K值优化研究
Clustering Algorithm K-value Optimization Research Based on Hadoop Platform

武霞,董增寿,孟晓燕

摘要(Abstract):

针对最大最小值原则的Kmeans聚类算法运行在Hadoop平台时需要多次遍历所有数据的问题,提出了一种改进的初始聚类中心的选择算法称为M+Kmeans算法。该算法只需要遍历一次全局数据极大的缩减了算法并行运算时消耗的时间。多组实验测试结果显示,设计的M+Kmeans算法适合运行在大规模集群Hadoop平台上,并且加速比和扩展率较原始算法有明显提高。

关键词(KeyWords): 聚类;大数据;Hadoop;Kmeans

Abstract:

Keywords:

基金项目(Foundation): 山西省自然科学基金(2012011015-4)

作者(Author): 武霞,董增寿,孟晓燕

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享