fiogf49gjkf0d
云计算平台下的数据挖掘研究
南京邮电大学    洑云龙  
本论文首先从云计算平台的相关理论出发,分析了Google文件系统、分布式编程模型map-reduce、分布式数据存储系统BigTable以及目前应用非常广泛的开源云计算平台hadoop的框架结构;其次以逻辑回归算法和关联规则算法为代表,提出了改进过后的能够应用于云计算平台上的算法;最后将算法移植到hadoop 平台上进行实验后发现算法耗费时间随着hadoop集群规模的增大而呈线性下降的。
云计算平台下的数据挖掘研究