混合MapReduce环境下大数据划分的查询优化

原文链接:万方

  • 作者:

    李伏,朱青

  • 摘要:

    在MapReduce与数据库的混合架构中,数据划分是影响查询性能的重要因素.对于开销最大的连接和聚集操作,采用混合MapReduce的方式实现,需要大规模数据的跨结点传输,网络传输和I/O开销巨大.为了减少传输的数据量,并提高连接操作的查询效率,提出了划分建议器模型.实现了MapReduce和数据库混合架构上的划分建议器,并计算划分代价,生成最优的数据划分方案,提高了系统效率.为了减少查询时间,依据划分建议器模型,提出了基于代价优先的生成策略和空间搜索算法,减少了划分建议器生成最优方案的时间.通过实验验证了划分建议器的有效性,使系统的整体查询代价最小,显著提高了系统性能.

  • 关键词:

    混合架构 查询优化 划分建议器

  • 作者单位:

    中国人民大学信息学院计算机系

  • 基金项目:

    国家自然科学基金 No.61070053% 上海市高可信计算重点实验室开放课题 No.07dz22304~~

  • DOI:

    10.3778/j.issn.1673-9418.2012.10.002

  • 来源期刊:

    计算机科学与探索

  • 年,卷(期):

    2012010

相似文献