一种改进的云数据直方图估计技术
史英杰 孟小峰 干艳桃
文章提出了对云计算中数据的直方图进行估计的技术HEDC++(An Extended Histogram Estimator for Data in the Cloud),对等宽直方图和等深直方图两种最常用的直方图类型分别提出了相应的估计方法。HEDC++基于改进的MapReduce处理框架提出了直方 图估计的数据处理流程,并设计了相应的采样机制保证采样的效率和估计结果的准确性。在Hadoop平台上对HEDC++进行了广泛的实验,实验结果表明 HEDC++能够有效的对不同分布的云数据提供直方图估计,其性能优于已有工作。
一种改进的云数据直方图估计技术