原文链接:万方
邱荣太
基于Map-reduce,提出了面向多核处理器应用于大规模集群的并行编程方法,应用该方法运行数据挖掘算法Canopy和K-means.针对K-means算法对初始聚类中心敏感,提出了基于Canopy的K-means优化算法.基于实际数据集的实验结果表明,多核Canopy-K-means聚类算法的准确度和执行效率随着核数的增多呈线性增长.
K-means Map-reduce 多核 Canopy
浙江传媒学院
微计算机信息
2012009